BAIN KHUSNUL KHOTIMAH (2020) Optimasi Pemodelan Hybrid Naive Bayes Berbobot Dengan Menggunakan Algoritma Genetika Pada Data Missing Value. Disertasi thesis, UNIVERSITAS AIRLANGGA.
Text (COVER)
1. COVER.pdf Download (190kB) |
|
Text (DAFTAR ISI)
2. DAFTAR ISI.pdf Download (210kB) |
|
Text (ABSTRAK)
3. ABSTRAK.pdf Download (119kB) |
|
Text (BAB 1)
4. BAB I PENDAHULUAN.pdf Download (304kB) |
|
Text (BAB 2)
5. BAB II TINJAUAN PUSTAKA.pdf Restricted to Registered users only until 20 January 2024. Download (638kB) | Request a copy |
|
Text (BAB 3)
6. BAB III KERANGKA KONSEP DAN HIPOTESIS.pdf Restricted to Registered users only until 20 January 2024. Download (160kB) | Request a copy |
|
Text (BAB 4)
7. BAB IV METODE PENELITIAN.pdf Restricted to Registered users only until 20 January 2024. Download (386kB) | Request a copy |
|
Text (BAB 5)
8. BAB V HASIL PENELITIAN DAN PEMBAHASAN.pdf Restricted to Registered users only until 20 January 2024. Download (599kB) | Request a copy |
|
Text (BAB 6)
9. BAB VI KESIMPULAN DAN SARAN.pdf Restricted to Registered users only until 20 January 2024. Download (107kB) | Request a copy |
|
Text (DAFTAR PUSTAKA)
10. DAFTAR PUSTAKA.pdf Download (106kB) |
|
Text (LAMPIRAN)
11. LAMPIRAN.pdf Restricted to Registered users only until 20 January 2024. Download (307kB) | Request a copy |
|
Text (EMBARGO)
Dis.M.05-21-Surat Pernyataan Embargo (Bain Khusnul K) - bain kk.pdf Restricted to Registered users only Download (228kB) | Request a copy |
Abstract
Dataset dimensi tinggi secara umum memiliki permasalahan yaitu adanya nilai yang hilang, yang disebabkan oleh kesalahan human error. Kesalahan tersebut terjadi karena pengamatan data tidak berjalan dengan baik, pengukuran tidak lengkap, dan permasalahan responden menolak untuk menjawab beberapa pertanyaan tertentu dalam survei. Nilai yang hilang dianggap bermasalah, karena nilai tersebut memiliki pengaruh besar pada saat pengambilan keputusan. Teknik imputasi digunakan untuk menghasilkan nilai pengganti yang hilang, sehingga diperoleh data lengkap yang dapat dianalisa secara sempurna. Kelemahan teknik imputasi telah menyebabkan adanya duplikat data, karena terdapat lebih dari satu data mempunyai nama yang sama, tetapi memiliki kelengkapan nilai yang berbeda. Metode Self Organizing Map Multiple Imputation (SOMMI) merupakan perbaikan dari metode Self Organizing Map Single Imputation (SOMSI) diusulkan untuk mengisi data yang hilang secara berulang kali (Multiple Imputation),dengan menggunakan beberapa bobot centroid untuk menangani data multivariate.SOMMI menggunakan teknik ensemble untuk menghasilkan beberapa bobot centroidpada kinerja clustering yang optimal. Hasil akhir imputasi dengan menggunakan bobot centroid akan menghasilkan data lengkap, yang akan dijadikan masukan pada klasifikasi Naïve Bayes (NB). Sehingga model yang menggabungkan SOMI dengan Naïve Bayes disebut dengan nama Self Organizing Map Imputation Naïve Bayes (SOMINB). Kelebihan pendekatan SOMINB dapat memanfaatkan beberapa nilai update bobot centroid untuk mengisi secara berulang setiap atribut yang terdapat nilai yang hilang.Pendekatan ini juga memiliki kelemahan yaitu adanya fitur dimensi tinggi yang menyebabkan masalah komputasi dan ketidakpastian nilai pengganti fitur pada pola data tertentu. Faktor fitur dimensi tinggi dapat diperbaiki dengan seleksi fitur dengan menggunakan Algoritma Genetika. Sehingga, penelitian ini memperkenalkan pendekatan baru yang menggabungkan prosedur preprosesing SOMI untuk mengatasi permasalahan data yang hilang dan optimasi Naïve Bayes Classifier (NBC) dengan Algorithm Genetika untuk seleksi fitur. Permasalahan lainnya, pemilihan nilai bobot optimal dan kesesuaian node jaringan menjadi masalah besar pada metode SOM. Algoritma Genetika juga digunakan untuk optimasi bobot pada clustering SOM, yaitu dengan menentukan bobot optimal di setiap cluster data. Bobot pada setiap cluster dipengaruhi oleh perubahan node output, selama proses pengelompokan pola input. Hasil penelitian dengan menggunakan model SOMINB menunjukkan nilai akurasi lebih tinggi senilai 90,00% dibandingkan dengan klasifikasi NB digabung dengan teknik imputasi lainnya. Pada tahap pengujian penggabungan preprosesing dengan Self Organizing Map Imputation, dan optimalisasi pemilihan fitur dengan Algoritma Genetika pada klasifikasi Naïve Bayes (SOMIGANB) telah menghasilkan akurasi 93,75. Model SOMIGANB lebih unggul dibandingkan penerapan pada klasifikasi data campuran kategori dan numerik lainnya. Hasil pemilihan bobot SOM pada missing value dengan menggunakan GA terbukti efisien dalam menemukan nilai bobot centroid untuk imputasi data multivariate.
Item Type: | Thesis (Disertasi) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Additional Information: | KKC KK Dis M 05-20 | |||||||||
Uncontrolled Keywords: | Missing Data, NBI, Imputasi, Preprocessing, SOMI, SOMMI, Optimasi Bobot, Algoritma Genetika, Seleksi Fitur, Fitness Function | |||||||||
Subjects: | Q Science > QA Mathematics > QA551-563 Analytic Geometry Q Science > QA Mathematics > QA564-581 Algebraic Geometry |
|||||||||
Divisions: | 08. Fakultas Sains dan Teknologi > Program Studi Matematika dan IPA (S3) | |||||||||
Creators: |
|
|||||||||
Contributors: |
|
|||||||||
Depositing User: | prasetyo adi nugroho | |||||||||
Date Deposited: | 29 Jan 2021 02:13 | |||||||||
Last Modified: | 29 Jan 2021 02:13 | |||||||||
URI: | http://repository.unair.ac.id/id/eprint/103410 | |||||||||
Sosial Share: | ||||||||||
Actions (login required)
View Item |