IMPLEMENTASI TF-ISF (TERM FREQUENCY – INVERSE SENTENCE FREQUENCY) DAN TITLE OVERLAP UNTUK MENCARI KALIMAT-KALIMAT PENTING PADA SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA

LUTHFI ALI, 080916010 (2013) IMPLEMENTASI TF-ISF (TERM FREQUENCY – INVERSE SENTENCE FREQUENCY) DAN TITLE OVERLAP UNTUK MENCARI KALIMAT-KALIMAT PENTING PADA SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA. Skripsi thesis, UNIVERSITAS AIRLANGGA.

[img]
Preview
Text (ABSTRAK)
gdlhub-gdl-s1-2013-aliluthfi-29067-6.abstr-k.pdf

Download (174kB) | Preview
[img] Text (FULLTEXT)
ST.SI 36-13 Ali i.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
Official URL: http://lib.unair.ac.id

Abstract

Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk memeriksa dokumen satu per satu. Oleh karena itu diperlukan sistem peringkas teks otomatis (automatic text summarization) yang digunakan untuk meringkas isi dokumen, sehingga pengguna cukup membaca ringkasannya saja. Untuk mencari kalimat-kalimat penting yang dijadikan sebagai ringkasan dokumen, sistem menghitung bobot tiap kalimat yang merepresentasikan nilai kepentingan kalimat tersebut. Metode yang digunakan untuk menghitung bobot kalimat dalam skripsi ini adalah TF-ISF (Term Frequency-Inverse Sentence Frequency) dan Title Overlap. Tahap dalam sistem ini untuk menghasilkan ringkasan adalah melakukan preprocessing terhadap dokumen, menghitung bobot tiap kalimat menggunakan Title Overlap dan TF-ISF, dan pemilihan kalimat-kalimat penting berdasarkan bobot tertinggi. Dokumen sample yang digunakan berupa 50 artikel berita yang didapatkan melalui situs berita online. Proses evaluasi dilakukan dengan membandingkan ringkasan hasil sistem dengan ringkasan yang dibuat oleh tiga orang peringkas. Dari proses membandingkan tersebut didapat nilai F-Measures yang merepresentasikan tingkat keberhasilan sistem dalam menghasilkan ringkasan. Evaluasi dilakukan pada metode Title Overlap, TF-ISF, gabungan antara Title Overlap dan TF-ISF, dan fitur Auto Summarize pada Microsoft Word 2007 sebagai pembanding. Dari penelitian ini diperoleh hasil evaluasi sistem dengan nilai F-Measrues sebesar 0.44 yang lebih tinggi dari fitur Auto Summarize pada Microsoft Word 2007 dengan nilai 0.4. Dari ketiga metode yang dievaluasi, metode Title Overlap memiliki F-Measures terbesar yaitu 0.496.

Item Type: Thesis (Skripsi)
Additional Information: KKC KK-2 ST.SI 36/13 Ali i
Uncontrolled Keywords: INFORMATION RETRIEVAL
Subjects: T Technology > T Technology (General) > T10.5-11.9 Communication of technical information
T Technology > T Technology (General) > T58.5-58.64 Information technology
Divisions: 08. Fakultas Sains dan Teknologi > Sistem Informasi
Creators:
CreatorsNIM
LUTHFI ALI, 080916010UNSPECIFIED
Contributors:
ContributionNameNIDN / NIDK
Thesis advisorBadrus Zaman, S.Kom, M.CsUNSPECIFIED
Depositing User: prasetyo adi nugroho
Date Deposited: 27 Dec 2013 12:00
Last Modified: 03 Aug 2016 03:48
URI: http://repository.unair.ac.id/id/eprint/25166
Sosial Share:

Actions (login required)

View Item View Item