TRIYAH FATMAWATI, 081211632016 (2016) PENERAPAN METODE COMMON PHRASE INDEX PADA QUERY FRASE UNTUK PENEMUKEMBALIAN INFORMASI. Skripsi thesis, Universitas Airlangga.
|
Text (ABSTRAK)
ST.SI 48-16 Fat p ABSTRAK.pdf Download (316kB) | Preview |
|
Text (FULLTEXT)
ST.SI 48-16 Fat p SKRIPSI.pdf Restricted to Registered users only Download (2MB) | Request a copy |
Abstract
Seiring berkembangnya teknologi, proses pencarian informasi pada teks berita dapat dilakukan dengan mudah, karena teks berita tidak hanya disebarkan dalam bentuk cetak, seperti surat kabar, melainkan juga dalam bentuk elektronik yang dapat diakses menggunakan search engine. Dalam proses pencarian dokumen relevan pada search engine, frase sering digunakan sebagai query. Jumlah kata yang menyusun query frase sangat memengaruhi tingkat relevansi dokumen yang dihasilkan. Oleh karena itu dilakukan penelitian ini untuk menganalisis penerapan metode common phrase index pada sistem temu kembali informasi. Penelitian akan dilakukan pada teks berita berbahasa Inggris sebanyak 100 dokumen dan diimplementasikan pada sebuah prototype untuk mengetahui tingkat relevansi dokumen yang dihasilkan. Tahap awal adalah penentuan common word, yang dilakukan berdasarkan jumlah keseluruhan frekuensi. Kemudian pada tahap implementasi, sistem dibangun dengan tahapan pre-processing, indexing, perhitungan term weighting, dan perhitungan cosine similarity. Sistem akan menampilkan dokumen hasil pencarian secara berurutan berdasarkan nilai cosine similarity, dari nilai terbesar hingga terkecil. Untuk menguji fungsionalitas sistem, dilakukan pengujian menggunakan metode black box dengan teknik equivalence class partitioning. Selanjutnya dilakukan uji coba menggunakan 100 dokumen dan 20 query. Hasil uji coba sistem tersebut digunakan untuk tahap evaluasi. Proses evaluasi terhadap sistem dilakukan dengan membandingkan dokumen relevan dengan hasil pencarian oleh sistem. Penentuan dokumen relevan dilakukan dengan menghitung nilai kappa statistic dengan judge sebanyak 3 orang. Dari perhitungan tersebut dihasilkan nilai kappa statistic sebesar 0,71 sehingga dokumen relevan tersebut layak untuk evaluasi sistem. Kemudian dilakukan perhitungan precision, recall, dan F-measure pada 2 skenario. Skenario pertama menghasilkan precision sebesar 0,43, recall sebesar 0,50, dan F-measure sebesar 0,46. Skenario kedua menghasilkan precision sebesar 0,43, recall sebesar 0,49, dan F-measure sebesar 0,46. Dari hasil perhitungan tersebut dapat dikatakan bahwa tingkat keberhasilan sistem dalam menghasilkan dokumen relevan adalah rendah.
Item Type: | Thesis (Skripsi) | ||||||
---|---|---|---|---|---|---|---|
Additional Information: | KKC KK ST.SI 48/16 Fat | ||||||
Subjects: | T Technology > T Technology (General) > T58.5-58.64 Information technology | ||||||
Divisions: | 08. Fakultas Sains dan Teknologi > Sistem Informasi | ||||||
Creators: |
|
||||||
Contributors: |
|
||||||
Depositing User: | mrs hoeroestijati beta | ||||||
Date Deposited: | 26 Apr 2017 22:38 | ||||||
Last Modified: | 26 Apr 2017 22:38 | ||||||
URI: | http://repository.unair.ac.id/id/eprint/56918 | ||||||
Sosial Share: | |||||||
Actions (login required)
View Item |