Eto Wuryanto, Drs.,DEA and Dyah Herawatie, Ir.,M.Si and Rimuljo Hendradi, S.Si.,M.Si (2006) PENENTUAN PELUANG KEPINDAHAN PELANGGAN DENGAN MENGGUNAKAN MODEL REGRESI LOGISTIK UNTUK DATA BERUKURAN BESAR. UNIVERSITAS AIRLANGGA. (Unpublished)
Text (FULL TEXT)
gdlhub-gdl-res-2008-wuryantoet-6960-lp6508.pdf Restricted to Registered users only Download (2MB) | Request a copy |
||
|
Text (ABSTRAK)
gdlhub-gdl-res-2008-wuryantoet-6960-lp6508-t.pdf Download (431kB) | Preview |
Abstract
Pemodelan regresi logistik sulit dilakukan jika data yang digunakan termasuk massive dataset yang pada dasarnya berkaitan dengan jumlah data yang sangat besar. Oleh karena itu, perlu dilakukan penyamplingan terhadap data induknya dan menurut penelitian sebelumnya data Squashing merupakan metode yang baik untuk mereduksi data yang telah dilakukan oleh Eto et at (2005) dan Rimuljo et at (2005). Dalam mendapatkan data Squashing ada dua tahap yang sulit yaitu : Pertama, pengelompokan atau pembuatan partisi terhadap data induk. Walaupun penelitian sebelumnya telah membahas data Squashing tetapi hanya melibatkan data dengan satu variabel. Sementara penggunaan model regresi logistik datanya minimal harus memuat 2 variabel sehingga akan terjadi kesulitan untuk mendapatkan partisi yang cocok. Akibatnya timbul persoalan, bagaimana cara pembuatan partisi untuk 2 variabel atau lebih. Kedua, metode apa yang bisa dipakai untuk menentukan nilai pseudo point dan pembobotnya untuk setiap partisi. Setelah diperoleh data Squashing, bagaimana cara menerapkan data Squashing tersebut pada model regresi logistik dan mengestimasi parameternya. Penelitian ini bertujuan mendapatkan data Squashing dengan dua variabel atau lebih dan menentukan estimator parameter model regresi logistik untuk data berukuran besar dengan program dalam bahasa C++ sebagai langkah awal dalam pembuatan software datamining. Untuk menentukan data Squashing dapat dilakukan dengan cara : Pertama, urutkan data berdasarkan variabel respon, sehingga didapat kelompok data dengan variabel respon nol dan kelompok data dengan variabel respon satu. Kedua, pada masing-masing variabel respon urutkan variabel prediktor berdasarkan varibel yang bertype non rasio. Ketiga, urutkan data yang ada di variabel rasio dari kecil ke besar. Keempat, pilih kelompok yang mempunyai anggota terbesar kemudian bagi ke dalam dua kelompok dan lakukan proses pembagian ini sampai diperoleh sebanyak kelompok yang diinginkan. Kelima, hitung nilai mean dan jumlah anggota dari tiap-tiap kelompok yang masing-masing merupakan nilai pengamatan baru (pseudo data point) dan pembobot. Sedangkan untuk mengestimasi parameter #946; pada Model Regresi Logistik dipakai metode MLE dan jika diketahui hasilnya berupa fungsi implisit maka digunakan metode Newton-Raphson. Implementasi algoritma metode squashing dan penentuan estimator parameter #946; pada model regresi logistik di lakukan dengan menggunakan program C++. Sedangkan data yang digunakan pada penelitian ini adalah data bangkitan berjumlah 100.000 data pengamatan dengan 3 variabel prediktor yang terdiri dari satu variabel berskala rasio (X1) , satu variabel berskala nominal 0,1 dan 2 (X2) , dan yang terakhir berskala nominal 0 dan 1 (X3). Penerapan program terhadap data bangkitan dengan 4 jenis kelompok data squashing menghasilkan nilai MSE semakin kecil seiring dengan membesarnya jumlah kelompok di data squashing. Sehingga dapat dikatakan bahwa secara umum estimator #946; dari data squashing dengan jumlah kelompok lebih banyak semakin mendekati nilai estimator #946; dari data induk. Adapun saran yang ingin disampaikan adalah : pembahasan ini dapat dikembangkan : pertama, untuk metode Squashing dengan jumlah variabel prediktor yang berskala rasio lebih dari satu. Kedua, perlu dibuatkan program untuk meng¬update data squashing baik jika ingin menambah jumlah kelompok maupun kalau ada data baru yang masuk dapat di update secara otomatis tanpa harus menghitung dari awal.
Item Type: | Other | ||||||||
---|---|---|---|---|---|---|---|---|---|
Additional Information: | KKC KK LP.65/08 Wur p | ||||||||
Uncontrolled Keywords: | Model Regresi Logistik; Squasing; C++; Software Datamining | ||||||||
Subjects: | S Agriculture > SH Aquaculture. Fisheries. Angling > SH1-691 Aquaculture. Fisheries. Angling > SH201-399 Fisheries > SH334 Economic aspects. Finance | ||||||||
Divisions: | Unair Research > Non-Exacta | ||||||||
Creators: |
|
||||||||
Depositing User: | Tn Yusuf Jailani | ||||||||
Date Deposited: | 05 Oct 2016 05:02 | ||||||||
Last Modified: | 05 Oct 2016 05:02 | ||||||||
URI: | http://repository.unair.ac.id/id/eprint/40781 | ||||||||
Sosial Share: | |||||||||
Actions (login required)
View Item |