NOVITA PRIANDINI, 081211632002 (2016) KATEGORISASI DOKUMEN DENGAN PENDEKATAN FUZZY C-MEANS DAN K-NEAREST NEIGHBORS. Skripsi thesis, UNIVERSITAS AIRLANGGA.
|
Text (ABSTRAK)
ABSTRAK.pdf Download (228kB) | Preview |
|
Text (FULL FEXT)
ST. SI. 26-16 Pri k.pdf Restricted to Registered users only Download (1MB) | Request a copy |
Abstract
Pengkategorian dokumen pada era perkembangan teknologi menjadi sangat penting karena jumlah dokumen yang bertambah semakin banyak. Memanajemen dokumen dengan mengkategorikannya menjadi salah satu solusi. Manajemen dokumen dengan mengkategorikan merupakan pengaplikasian Information Retrieval karena melibatkan text mining dalam prosesnya. Teknik pengkategorian dapat menggunakan metode Fuzy C-Means (FCM) maupun KNearest Neighbors (KNN). Penelitian ini akan menggabungkan dua teknik pengkategorian. Dokumen yang digunakan dalam penelitian berjumlah 180 dokumen dengan pembagian 160 dokumen sebagi dokumen training dan 20 dokumen sebagia dokumen testing. Langkah-langkah kategorisasi dokumen dilakukan dalam tiga tahap. Tahap pertama yaitu transformasi dokumen hingga menghasilkan bobot setiap token. Hasil pembobotan akan membentuk sebuah matriks dokumen yang digunakan pada tahap kedua yaitu pengelompokan dokumen dengan FCM. Pengelompokan dokumen hanya dilalui oleh dokumen training saja. Kemudian tahap ketiga adalah pengkategorian dokumen testing yang dilakukan dengan melakukan proses KNN terhadap kelompok dokumen training yang memiliki jarak terdekat dengan dokumen testing. Pada pengelompokan dokumen training, dihasilkan empat cluster dengan rincian 57 dokumen pada cluster 1, 26 dokumen pada cluster 2, 20 dokumen pada cluster 3, dan 57 dokumen pada cluster 4. Hasil dari penelitian menunjukkan bahwa 14 dokumen testing relevan dengan kategori sebenarnya. Sementara 6 dokumen testing tidak relevan dengan kategori sebenarnya. Hasil evaluasi sistem menunjukkan nilai Precision sebesar 0,7 dengan Recall sebesar 0,7. Sementara Fmeasures juga sebesar 0,7. Kesimpulan penelitian adalah pengelompokan dokumen terlebih dahulu dapat menghasilkan tolok ukur keberhasilan sistem temu kembali informasi yang cukup baik.
Item Type: | Thesis (Skripsi) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Additional Information: | KKC KK ST. SI. 26/16 Pri k | |||||||||
Uncontrolled Keywords: | Kategorisasi Dokumen, Fuzy C-Means, K-Nearest Neighbors, Information Retrieval | |||||||||
Subjects: | T Technology > T Technology (General) > T58.6-58.62 Management information systems | |||||||||
Divisions: | 08. Fakultas Sains dan Teknologi > Sistem Informasi | |||||||||
Creators: |
|
|||||||||
Contributors: |
|
|||||||||
Depositing User: | sukartini sukartini | |||||||||
Date Deposited: | 22 Jun 2016 04:06 | |||||||||
Last Modified: | 22 Jun 2016 04:06 | |||||||||
URI: | http://repository.unair.ac.id/id/eprint/33206 | |||||||||
Sosial Share: | ||||||||||
Actions (login required)
View Item |