LUTHFI ALI, 080916010 (2013) IMPLEMENTASI TF-ISF (TERM FREQUENCY – INVERSE SENTENCE FREQUENCY) DAN TITLE OVERLAP UNTUK MENCARI KALIMAT-KALIMAT PENTING PADA SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA. Skripsi thesis, UNIVERSITAS AIRLANGGA.
|
Text (ABSTRAK)
gdlhub-gdl-s1-2013-aliluthfi-29067-6.abstr-k.pdf Download (174kB) | Preview |
|
Text (FULLTEXT)
ST.SI 36-13 Ali i.pdf Restricted to Registered users only Download (2MB) | Request a copy |
Abstract
Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk memeriksa dokumen satu per satu. Oleh karena itu diperlukan sistem peringkas teks otomatis (automatic text summarization) yang digunakan untuk meringkas isi dokumen, sehingga pengguna cukup membaca ringkasannya saja. Untuk mencari kalimat-kalimat penting yang dijadikan sebagai ringkasan dokumen, sistem menghitung bobot tiap kalimat yang merepresentasikan nilai kepentingan kalimat tersebut. Metode yang digunakan untuk menghitung bobot kalimat dalam skripsi ini adalah TF-ISF (Term Frequency-Inverse Sentence Frequency) dan Title Overlap. Tahap dalam sistem ini untuk menghasilkan ringkasan adalah melakukan preprocessing terhadap dokumen, menghitung bobot tiap kalimat menggunakan Title Overlap dan TF-ISF, dan pemilihan kalimat-kalimat penting berdasarkan bobot tertinggi. Dokumen sample yang digunakan berupa 50 artikel berita yang didapatkan melalui situs berita online. Proses evaluasi dilakukan dengan membandingkan ringkasan hasil sistem dengan ringkasan yang dibuat oleh tiga orang peringkas. Dari proses membandingkan tersebut didapat nilai F-Measures yang merepresentasikan tingkat keberhasilan sistem dalam menghasilkan ringkasan. Evaluasi dilakukan pada metode Title Overlap, TF-ISF, gabungan antara Title Overlap dan TF-ISF, dan fitur Auto Summarize pada Microsoft Word 2007 sebagai pembanding. Dari penelitian ini diperoleh hasil evaluasi sistem dengan nilai F-Measrues sebesar 0.44 yang lebih tinggi dari fitur Auto Summarize pada Microsoft Word 2007 dengan nilai 0.4. Dari ketiga metode yang dievaluasi, metode Title Overlap memiliki F-Measures terbesar yaitu 0.496.
Item Type: | Thesis (Skripsi) | ||||||
---|---|---|---|---|---|---|---|
Additional Information: | KKC KK-2 ST.SI 36/13 Ali i | ||||||
Uncontrolled Keywords: | INFORMATION RETRIEVAL | ||||||
Subjects: | T Technology > T Technology (General) > T10.5-11.9 Communication of technical information T Technology > T Technology (General) > T58.5-58.64 Information technology |
||||||
Divisions: | 08. Fakultas Sains dan Teknologi > Sistem Informasi | ||||||
Creators: |
|
||||||
Contributors: |
|
||||||
Depositing User: | prasetyo adi nugroho | ||||||
Date Deposited: | 27 Dec 2013 12:00 | ||||||
Last Modified: | 03 Aug 2016 03:48 | ||||||
URI: | http://repository.unair.ac.id/id/eprint/25166 | ||||||
Sosial Share: | |||||||
Actions (login required)
View Item |