PENERAPAN METODE COMMON PHRASE INDEX PADA QUERY FRASE UNTUK PENEMUKEMBALIAN INFORMASI

TRIYAH FATMAWATI, 081211632016 (2016) PENERAPAN METODE COMMON PHRASE INDEX PADA QUERY FRASE UNTUK PENEMUKEMBALIAN INFORMASI. Skripsi thesis, Universitas Airlangga.

[img]
Preview
Text (ABSTRAK)
ST.SI 48-16 Fat p ABSTRAK.pdf

Download (316kB) | Preview
[img] Text (FULLTEXT)
ST.SI 48-16 Fat p SKRIPSI.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
Official URL: http://lib.unair.ac.id

Abstract

Seiring berkembangnya teknologi, proses pencarian informasi pada teks berita dapat dilakukan dengan mudah, karena teks berita tidak hanya disebarkan dalam bentuk cetak, seperti surat kabar, melainkan juga dalam bentuk elektronik yang dapat diakses menggunakan search engine. Dalam proses pencarian dokumen relevan pada search engine, frase sering digunakan sebagai query. Jumlah kata yang menyusun query frase sangat memengaruhi tingkat relevansi dokumen yang dihasilkan. Oleh karena itu dilakukan penelitian ini untuk menganalisis penerapan metode common phrase index pada sistem temu kembali informasi. Penelitian akan dilakukan pada teks berita berbahasa Inggris sebanyak 100 dokumen dan diimplementasikan pada sebuah prototype untuk mengetahui tingkat relevansi dokumen yang dihasilkan. Tahap awal adalah penentuan common word, yang dilakukan berdasarkan jumlah keseluruhan frekuensi. Kemudian pada tahap implementasi, sistem dibangun dengan tahapan pre-processing, indexing, perhitungan term weighting, dan perhitungan cosine similarity. Sistem akan menampilkan dokumen hasil pencarian secara berurutan berdasarkan nilai cosine similarity, dari nilai terbesar hingga terkecil. Untuk menguji fungsionalitas sistem, dilakukan pengujian menggunakan metode black box dengan teknik equivalence class partitioning. Selanjutnya dilakukan uji coba menggunakan 100 dokumen dan 20 query. Hasil uji coba sistem tersebut digunakan untuk tahap evaluasi. Proses evaluasi terhadap sistem dilakukan dengan membandingkan dokumen relevan dengan hasil pencarian oleh sistem. Penentuan dokumen relevan dilakukan dengan menghitung nilai kappa statistic dengan judge sebanyak 3 orang. Dari perhitungan tersebut dihasilkan nilai kappa statistic sebesar 0,71 sehingga dokumen relevan tersebut layak untuk evaluasi sistem. Kemudian dilakukan perhitungan precision, recall, dan F-measure pada 2 skenario. Skenario pertama menghasilkan precision sebesar 0,43, recall sebesar 0,50, dan F-measure sebesar 0,46. Skenario kedua menghasilkan precision sebesar 0,43, recall sebesar 0,49, dan F-measure sebesar 0,46. Dari hasil perhitungan tersebut dapat dikatakan bahwa tingkat keberhasilan sistem dalam menghasilkan dokumen relevan adalah rendah.

Item Type: Thesis (Skripsi)
Additional Information: KKC KK ST.SI 48/16 Fat
Subjects: T Technology > T Technology (General) > T58.5-58.64 Information technology
Divisions: 08. Fakultas Sains dan Teknologi > Sistem Informasi
Creators:
CreatorsNIM
TRIYAH FATMAWATI, 081211632016UNSPECIFIED
Contributors:
ContributionNameNIDN / NIDK
Thesis advisorBadrus Zaman, S.Kom., M.Cs.UNSPECIFIED
Depositing User: mrs hoeroestijati beta
Date Deposited: 26 Apr 2017 22:38
Last Modified: 26 Apr 2017 22:38
URI: http://repository.unair.ac.id/id/eprint/56918
Sosial Share:

Actions (login required)

View Item View Item