SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA DENGAN METODE LATENT SEMANTIC ANALYSIS (LSA)

Ramadhan Akira Rahadian, 081411631014 (2018) SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA DENGAN METODE LATENT SEMANTIC ANALYSIS (LSA). Skripsi thesis, UNIVERSITAS AIRLANGGA.

[img] Text (ABSTRAK)
ABSTRAK ST.SI 47 18 Rah s.pdf

Download (84kB)
[img] Text (FULLTEXT)
FULLTEXT ST.SI 47 18 Rah s.pdf
Restricted to Registered users only until 10 January 2022.

Download (1MB) | Request a copy
Official URL: http://lib.unair.ac.id

Abstract

Automatic text summarization hingga saat ini masih terus dianalisis dan diteliti untuk mencapai ringkasan yang dapat mendekati ringkasan buatan manusia. Salah satu metode yang dapat digunakan dalam automatic text summarization adalah Latent Semantic Analysis (LSA). Metode LSA dipilih untuk membuktikan akurasi jika diterapkan pada dokumen berbahasa Indonesia dengan jumlah kalimat yang banyak. Tahapan penelitian dimulai dengan tahap preprocessing yang terdiri dengan sentence segmentation, case folding, tokenization, stopword removal, dan stemming. Berikutnya dilakukan tahapan pembobotan dokumen dengan menggunakan metode TF-ISF (Term Frequency-Inverse Sentence Frequency). Setelah itu tahapan metode LSA dimulai dengan pembuatan matriks, perhitungan SVD (Singular Value Decomposition), dan sentence selection dengan menggunakan Cross Method dilakukan. Dokumen yang digunakan pada penelitian ini berjumlah 50 dokumen artikel kolom. Proses evaluasi dilakukan melalui 3 tahapan yaitu perhitungan Nilai Kappa, pemilihan kalimat relevan, dan perhitungan Precision, Recall, dan F-Measure dengan compression rate sebesar 30% dan 20% . Kalimat relevan dari 2 evaluator dibandingkan dengan sistem dan Microsoft Word 2007 melalui fitur auto summarize. Hasil dari LSA dengan compression rate 30% adalah 53,91% lalu dengan compression rate 20% adalah 45,91% sedangkan hasil dari Microsoft Word 2007 dengan compression rate 30% adalah 19,01% dan 17,57% untuk compression rate 20%.

Item Type: Thesis (Skripsi)
Additional Information: KKC KK ST.SI 47/18 Rah s
Uncontrolled Keywords: Automatic Text Summarization, SVD, LSA, Cross Method, Bahasa Indonesia
Subjects: Q Science > QA Mathematics > QA76.73. Computer algorithms and Data structures
Q Science > QA Mathematics > QA76.75-76.765 Computer software
Q Science > QA Mathematics > QA76.9.L63 Logic, Symbolic, mathematical and Computer logic
Divisions: 08. Fakultas Sains dan Teknologi > Sistem Informasi
Creators:
CreatorsNIM
Ramadhan Akira Rahadian, 081411631014UNSPECIFIED
Contributors:
ContributionNameNIDN / NIDK
Thesis advisorBadrus Zaman, S.Kom., M.Cs.UNSPECIFIED
Depositing User: Dwi Prihastuti
Date Deposited: 10 Jan 2019 07:00
Last Modified: 23 Aug 2023 02:57
URI: http://repository.unair.ac.id/id/eprint/78292
Sosial Share:

Actions (login required)

View Item View Item