Optimasi Pemodelan Hybrid Naive Bayes Berbobot Dengan Menggunakan Algoritma Genetika Pada Data Missing Value

BAIN KHUSNUL KHOTIMAH (2020) Optimasi Pemodelan Hybrid Naive Bayes Berbobot Dengan Menggunakan Algoritma Genetika Pada Data Missing Value. Disertasi thesis, UNIVERSITAS AIRLANGGA.

[img] Text (COVER)
1. COVER.pdf

Download (190kB)
[img] Text (DAFTAR ISI)
2. DAFTAR ISI.pdf

Download (210kB)
[img] Text (ABSTRAK)
3. ABSTRAK.pdf

Download (119kB)
[img] Text (BAB 1)
4. BAB I PENDAHULUAN.pdf

Download (304kB)
[img] Text (BAB 2)
5. BAB II TINJAUAN PUSTAKA.pdf
Restricted to Registered users only until 20 January 2024.

Download (638kB) | Request a copy
[img] Text (BAB 3)
6. BAB III KERANGKA KONSEP DAN HIPOTESIS.pdf
Restricted to Registered users only until 20 January 2024.

Download (160kB) | Request a copy
[img] Text (BAB 4)
7. BAB IV METODE PENELITIAN.pdf
Restricted to Registered users only until 20 January 2024.

Download (386kB) | Request a copy
[img] Text (BAB 5)
8. BAB V HASIL PENELITIAN DAN PEMBAHASAN.pdf
Restricted to Registered users only until 20 January 2024.

Download (599kB) | Request a copy
[img] Text (BAB 6)
9. BAB VI KESIMPULAN DAN SARAN.pdf
Restricted to Registered users only until 20 January 2024.

Download (107kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
10. DAFTAR PUSTAKA.pdf

Download (106kB)
[img] Text (LAMPIRAN)
11. LAMPIRAN.pdf
Restricted to Registered users only until 20 January 2024.

Download (307kB) | Request a copy
[img] Text (EMBARGO)
Dis.M.05-21-Surat Pernyataan Embargo (Bain Khusnul K) - bain kk.pdf
Restricted to Registered users only

Download (228kB) | Request a copy
Official URL: http://lib.unair.ac.id

Abstract

Dataset dimensi tinggi secara umum memiliki permasalahan yaitu adanya nilai yang hilang, yang disebabkan oleh kesalahan human error. Kesalahan tersebut terjadi karena pengamatan data tidak berjalan dengan baik, pengukuran tidak lengkap, dan permasalahan responden menolak untuk menjawab beberapa pertanyaan tertentu dalam survei. Nilai yang hilang dianggap bermasalah, karena nilai tersebut memiliki pengaruh besar pada saat pengambilan keputusan. Teknik imputasi digunakan untuk menghasilkan nilai pengganti yang hilang, sehingga diperoleh data lengkap yang dapat dianalisa secara sempurna. Kelemahan teknik imputasi telah menyebabkan adanya duplikat data, karena terdapat lebih dari satu data mempunyai nama yang sama, tetapi memiliki kelengkapan nilai yang berbeda. Metode Self Organizing Map Multiple Imputation (SOMMI) merupakan perbaikan dari metode Self Organizing Map Single Imputation (SOMSI) diusulkan untuk mengisi data yang hilang secara berulang kali (Multiple Imputation),dengan menggunakan beberapa bobot centroid untuk menangani data multivariate.SOMMI menggunakan teknik ensemble untuk menghasilkan beberapa bobot centroidpada kinerja clustering yang optimal. Hasil akhir imputasi dengan menggunakan bobot centroid akan menghasilkan data lengkap, yang akan dijadikan masukan pada klasifikasi Naïve Bayes (NB). Sehingga model yang menggabungkan SOMI dengan Naïve Bayes disebut dengan nama Self Organizing Map Imputation Naïve Bayes (SOMINB). Kelebihan pendekatan SOMINB dapat memanfaatkan beberapa nilai update bobot centroid untuk mengisi secara berulang setiap atribut yang terdapat nilai yang hilang.Pendekatan ini juga memiliki kelemahan yaitu adanya fitur dimensi tinggi yang menyebabkan masalah komputasi dan ketidakpastian nilai pengganti fitur pada pola data tertentu. Faktor fitur dimensi tinggi dapat diperbaiki dengan seleksi fitur dengan menggunakan Algoritma Genetika. Sehingga, penelitian ini memperkenalkan pendekatan baru yang menggabungkan prosedur preprosesing SOMI untuk mengatasi permasalahan data yang hilang dan optimasi Naïve Bayes Classifier (NBC) dengan Algorithm Genetika untuk seleksi fitur. Permasalahan lainnya, pemilihan nilai bobot optimal dan kesesuaian node jaringan menjadi masalah besar pada metode SOM. Algoritma Genetika juga digunakan untuk optimasi bobot pada clustering SOM, yaitu dengan menentukan bobot optimal di setiap cluster data. Bobot pada setiap cluster dipengaruhi oleh perubahan node output, selama proses pengelompokan pola input. Hasil penelitian dengan menggunakan model SOMINB menunjukkan nilai akurasi lebih tinggi senilai 90,00% dibandingkan dengan klasifikasi NB digabung dengan teknik imputasi lainnya. Pada tahap pengujian penggabungan preprosesing dengan Self Organizing Map Imputation, dan optimalisasi pemilihan fitur dengan Algoritma Genetika pada klasifikasi Naïve Bayes (SOMIGANB) telah menghasilkan akurasi 93,75. Model SOMIGANB lebih unggul dibandingkan penerapan pada klasifikasi data campuran kategori dan numerik lainnya. Hasil pemilihan bobot SOM pada missing value dengan menggunakan GA terbukti efisien dalam menemukan nilai bobot centroid untuk imputasi data multivariate.

Item Type: Thesis (Disertasi)
Additional Information: KKC KK Dis M 05-20
Uncontrolled Keywords: Missing Data, NBI, Imputasi, Preprocessing, SOMI, SOMMI, Optimasi Bobot, Algoritma Genetika, Seleksi Fitur, Fitness Function
Subjects: Q Science > QA Mathematics > QA551-563 Analytic Geometry
Q Science > QA Mathematics > QA564-581 Algebraic Geometry
Divisions: 08. Fakultas Sains dan Teknologi > Program Studi Matematika dan IPA (S3)
Creators:
CreatorsNIM
BAIN KHUSNUL KHOTIMAHNIM081617027304
Contributors:
ContributionNameNIDN / NIDK
Thesis advisorMiswantoNIDN0002046803
Thesis advisorHerry SuprajitnoNIDN0004046803
Depositing User: prasetyo adi nugroho
Date Deposited: 29 Jan 2021 02:13
Last Modified: 29 Jan 2021 02:13
URI: http://repository.unair.ac.id/id/eprint/103410
Sosial Share:

Actions (login required)

View Item View Item