OPTIMASI ADABOOST-C4.5 MENGGUNAKAN K-NEAREST NEIGHBOR IMPUTATION BERBASIS RELIEFF FEATURE SELECTION UNTUK DIAGNOSIS PENYAKIT GINJAL KRONIS
Rieqy Muwachid Erysya, 4611416027 (2020) OPTIMASI ADABOOST-C4.5 MENGGUNAKAN K-NEAREST NEIGHBOR IMPUTATION BERBASIS RELIEFF FEATURE SELECTION UNTUK DIAGNOSIS PENYAKIT GINJAL KRONIS. Under Graduates thesis, Universitas Negeri Semarang.
PDF (OPTIMASI ADABOOST-C4.5 MENGGUNAKAN K-NEAREST NEIGHBOR IMPUTATION BERBASIS RELIEFF FEATURE SELECTION UNTUK DIAGNOSIS PENYAKIT GINJAL KRONIS)
- Published Version
Restricted to Repository staff only Download (6MB) | Request a copy |
Abstract
Data mining adalah proses pencarian pola secara otomatis dalam database yang besar menggunakan teknik statistik dan pembelajaran mesin. Pada bidang kesehatan, data mining dapat digunakan untuk mendiagnosa penyakit berdasarkan data rekaman pasien-pasien sebelumnya. Pada penelitian ini, akan dilakukan diagnosa penyakit ginjal berdasarkan dataset Chronic Kidney Disease (CKD) yang diperoleh dari UCI machine learning repository. Pada dataset tersebut, sebanyak 242 record terdapat missing value, sedangkan record yang tidak memiliki missing value sebanyak 158. Missing value adalah kasus di mana terdapat nilai yang hilang pada salah satu atribut pada record sehingga mengurangi kualitas data. Untuk mengatasi hal ini dilakukan teknik imputasi untuk mengisi nilai yang hilang tersebut. Dalam penelitian ini dilakukan perbandingan teknik imputasi menggunakan 3 metode yaitu mean/mode, KNN, dan KNN+ReliefF. Setelah dataset diimputasi dengan ketiga metode tersebut, kemudian dilakukan klasifikasi menggunakan model C4.5 dan Adaboost+C4.5. Teknik pruning tidak diterapkan dalam C4.5 pada penelitian ini. Setelah dihitung akurasinya menggunakan 10-cross validation, akurasi model C4.5 pada dataset hasil imputasi mean/mode, KNN, dan KNN+ReliefF masing-masing adalah 96,75%, 98,25%, dan 100%. Sedangkan model Adaboost+C4.5 pada dataset hasil imputasi mean/mode, KNN, dan KNN+ReliefF masing-masing adalah 97,75%, 98,75%, dan 100%. Dalam imputasi tersebut, parameter yang digunakan adalah k = 14 untuk KNN, sedangkan parameter n_neighbors = 10, dan top_features = 0,6 untuk ReliefF. Berdasarkan hasil akurasi yang didapat, metode imputasi KNN+ReliefF adalah yang terbaik, karena mendapat akurasi 100% pada kedua model, yaitu C4.5 dan Adaboost+C4.5.
Item Type: | Thesis (Under Graduates) |
---|---|
Uncontrolled Keywords: | klasifikasi, decision tree, c4.5, adaboost, imputasi, knn, relief feature selection. |
Subjects: | T Technology > Computer Engineering |
Fakultas: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1 |
Depositing User: | indah tri pujiati |
Date Deposited: | 27 Aug 2021 02:47 |
Last Modified: | 27 Aug 2021 02:47 |
URI: | http://lib.unnes.ac.id/id/eprint/44805 |
Actions (login required)
View Item |