APLIKASI TEXT MINING MENGGUNAKAN ALGORITMA TF-IDF DAN VSM PADA E-LIBRARY FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA

BAYU CHARISMA PUTRA, 080912011 (2013) APLIKASI TEXT MINING MENGGUNAKAN ALGORITMA TF-IDF DAN VSM PADA E-LIBRARY FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA. Skripsi thesis, UNIVERSITAS AIRLANGGA.

[img]
Preview
Text (ABSTRAK)
gdlhub-gdl-s1-2013-putrabayuc-27179-3.abstr-k.pdf

Download (203kB) | Preview
[img] Text (FULLTEXT)
MPM.53-13.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
Official URL: http://lib.unair.ac.id

Abstract

enulisan skripsi ini bertujuan untuk mengimplementasikan text mining pada E-Library Fakultas Sains dan Teknologi menggunakan algoritma TF-IDF dan VSM. Text mining didefinisikan sebagai serangkaian proses untuk menggali informasi dari data berupa teks dimana sumber data biasanya didapatkan dari dokumen. Di dalam text mining dilakukan beberapa tahapan umum yaitu tokenizing, filtering, stemming dan analyzing. Tokenizing merupakan tahap pemotongan string input dari tiap kata yang menyusunnya. Filtering merupakan pengambilan kata-kata penting dari hasil tokenizing. Stemming merupakan proses pencarian kata dasar dari tiap kata hasil filtering. Analyzing adalah tahap penentuan seberapa jauh keterhubungan antar kata-kata antar dokumen. Algoritma yang digunakan pada tahap analyzing ini adalah algoritma TF-IDF (Term Frequency – Inversed Document Frequency) dan VSM (Vector Space Model). TF-IDF merupakan pemberian bobot hubungan suatu term terhadap dokumen. VSM merupakan pengukuran kemiripan antara suatu dokumen dengan kata kunci, yaitu dengan menghitung nilai cosinus antara vektor tiap dokumen dan vektor dari kata kunci. Hasil output text mining menggunakan algoritma TF-IDF dan VSM pada E-library Fakultas Sains dan Teknologi Universitas Airlangga ini adalah pengurutan dokumen yang telah diberi bobot dari yang terbesar hingga yang paling kecil. data dokumen yang digunakan adalah sinopsis dari buku-buku yang terdapat di ruang baca Fakultas Sains dan Teknologi, abstrak dari jurnal umum yang berhubungan dengan sains dan teknologi dan abstrak dari skripsi mahasiswa Fakultas Sains dan Teknologi. Permasalahan diatas diselesaikan dengan bahasa pemrograman PHP (Personal Home Page) dengan NetBeans IDE 6.8.

Item Type: Thesis (Skripsi)
Additional Information: KKC KK-2 MPM 53/13 Put a
Uncontrolled Keywords: APLIKASI TEXT MINING
Subjects: Q Science > QA Mathematics > QA276-280 Mathematical Analysis
Q Science > QA Mathematics > QA801-939 Analytic Mechanics
Divisions: 08. Fakultas Sains dan Teknologi > Matematika
Creators:
CreatorsEmail
BAYU CHARISMA PUTRA, 080912011UNSPECIFIED
Contributors:
ContributionNameEmail
ContributorAuli Damayanti,, S.Si, M.SiUNSPECIFIED
Depositing User: prasetyo adi nugroho
Date Deposited: 08 Oct 2013 12:00
Last Modified: 01 Aug 2016 01:53
URI: http://repository.unair.ac.id/id/eprint/25090
Sosial Share:

Actions (login required)

View Item View Item