KATEGORISASI DOKUMEN DENGAN PENDEKATAN FUZZY C-MEANS DAN K-NEAREST NEIGHBORS

NOVITA PRIANDINI, 081211632002 (2016) KATEGORISASI DOKUMEN DENGAN PENDEKATAN FUZZY C-MEANS DAN K-NEAREST NEIGHBORS. Skripsi thesis, UNIVERSITAS AIRLANGGA.

[img]
Preview
Text (ABSTRAK)
ABSTRAK.pdf

Download (228kB) | Preview
[img] Text (FULL FEXT)
ST. SI. 26-16 Pri k.pdf
Restricted to Registered users only

Download (1MB) | Request a copy
Official URL: http://lib.unair.ac.id

Abstract

Pengkategorian dokumen pada era perkembangan teknologi menjadi sangat penting karena jumlah dokumen yang bertambah semakin banyak. Memanajemen dokumen dengan mengkategorikannya menjadi salah satu solusi. Manajemen dokumen dengan mengkategorikan merupakan pengaplikasian Information Retrieval karena melibatkan text mining dalam prosesnya. Teknik pengkategorian dapat menggunakan metode Fuzy C-Means (FCM) maupun KNearest Neighbors (KNN). Penelitian ini akan menggabungkan dua teknik pengkategorian. Dokumen yang digunakan dalam penelitian berjumlah 180 dokumen dengan pembagian 160 dokumen sebagi dokumen training dan 20 dokumen sebagia dokumen testing. Langkah-langkah kategorisasi dokumen dilakukan dalam tiga tahap. Tahap pertama yaitu transformasi dokumen hingga menghasilkan bobot setiap token. Hasil pembobotan akan membentuk sebuah matriks dokumen yang digunakan pada tahap kedua yaitu pengelompokan dokumen dengan FCM. Pengelompokan dokumen hanya dilalui oleh dokumen training saja. Kemudian tahap ketiga adalah pengkategorian dokumen testing yang dilakukan dengan melakukan proses KNN terhadap kelompok dokumen training yang memiliki jarak terdekat dengan dokumen testing. Pada pengelompokan dokumen training, dihasilkan empat cluster dengan rincian 57 dokumen pada cluster 1, 26 dokumen pada cluster 2, 20 dokumen pada cluster 3, dan 57 dokumen pada cluster 4. Hasil dari penelitian menunjukkan bahwa 14 dokumen testing relevan dengan kategori sebenarnya. Sementara 6 dokumen testing tidak relevan dengan kategori sebenarnya. Hasil evaluasi sistem menunjukkan nilai Precision sebesar 0,7 dengan Recall sebesar 0,7. Sementara Fmeasures juga sebesar 0,7. Kesimpulan penelitian adalah pengelompokan dokumen terlebih dahulu dapat menghasilkan tolok ukur keberhasilan sistem temu kembali informasi yang cukup baik.

Item Type: Thesis (Skripsi)
Additional Information: KKC KK ST. SI. 26/16 Pri k
Uncontrolled Keywords: Kategorisasi Dokumen, Fuzy C-Means, K-Nearest Neighbors, Information Retrieval
Subjects: T Technology > T Technology (General) > T58.6-58.62 Management information systems
Divisions: 08. Fakultas Sains dan Teknologi > Sistem Informasi
Creators:
CreatorsNIM
NOVITA PRIANDINI, 081211632002UNSPECIFIED
Contributors:
ContributionNameNIDN / NIDK
Thesis advisorBadrus Zaman, S.Kom., M.CsUNSPECIFIED
Thesis advisorEndah Purwanti, S.Si., M.KomUNSPECIFIED
Depositing User: sukartini sukartini
Date Deposited: 22 Jun 2016 04:06
Last Modified: 22 Jun 2016 04:06
URI: http://repository.unair.ac.id/id/eprint/33206
Sosial Share:

Actions (login required)

View Item View Item