OPTIMASI ALGORITMA C4.5 MENGGUNAKAN SELEKSI FITUR PARTICLE SWARM OPTIMIZATION (PSO) DAN TEKNIK BAGGING PADA DIAGNOSIS PENYAKIT KANKER PAYUDARA
Raka Hendra Saputra , 4611415027 (2020) OPTIMASI ALGORITMA C4.5 MENGGUNAKAN SELEKSI FITUR PARTICLE SWARM OPTIMIZATION (PSO) DAN TEKNIK BAGGING PADA DIAGNOSIS PENYAKIT KANKER PAYUDARA. Under Graduates thesis, Universitas Negeri Semarang.
PDF
- Published Version
Download (1MB) |
Abstract
Kanker payudara merupakan penyebab utama kedua kematian akibat kanker pada wanita saat ini dan telah menjadi kanker paling umum di antara wanita di negara maju dan negara berkembang dalam beberapa tahun terakhir. Dengan adanya pendeteksian dini penanganan menjadi lebih cepat sehingga risiko kematian akibat kanker payudara dapat dikurangi. Dalam usaha pendeteksian dini, data mining dapat digunakan untuk mendiagnosis kanker payudara. Data mining terdiri dari beberapa model penelitian, salah satunya adalah klasifikasi. Metode paling umum digunakan dalam klasifikasi merupakan decision tree. C4.5 adalah algoritma dalam decision tree yang sering digunakan dalam melakukan proses klasifikasi. Dalam penelitian ini, data yang digunakan adalah Breast Cancer Wisconsin (Original) Data Set yang diperoleh dari UCI Machine Learning Repository. Breast Cancer Wisconsin (Original) Data Set memiliki 9 fitur dan 1 kelas. Dataset ini mengalami ketidakseimbangan kelas dimana benign sebanyak 458 (65,5%) data dan malignant sebanyak 241 (34,5%) data. Tujuan dari penelitian ini adalah menyeleksi fitur yang akan digunakan dan mengatasi ketidakseimbangan kelas yang terjadi sehingga kinerja algoritma C4.5 menjadi lebih optimal dalam melakukan proses klasifikasi. Metode yang digunakan sebagai seleksi fitur adalah PSO dan bagging untuk mengatasi ketidakseimbangan kelas. Klasifikasi diuji menggunakan confusion matrix untuk mengetahui akurasi yang dihasilkan. Dari hasil penelitian ini, penerapan PSO sebagai seleksi fitur dan bagging untuk mengatasi ketidakseimbangan kelas dengan algoritma C4.5 berhasil meningkatkan akurasi sebesar 5,11%. Dengan akurasi awal 93,43%, setelah penerapan PSO dan bagging menjadi 98,54%. Penelitian ini dapat digunakan sebagai acuan peneliti selanjutnya yang berfokus pada perbaikan algoritma sehingga akurasi yang dihasilkan dapat lebih baik. PSO dalam penelitian ini kurang efisien dalam melakukan seleksi fitur sehingga penelitian selanjutnya juga diharapkan dapat mengatasi masalah ini dengan menggunakan metode lain dalam melakukan seleksi fitur.
Item Type: | Thesis (Under Graduates) |
---|---|
Uncontrolled Keywords: | Data mining, Decision tree, klasifikasi, C4.5, PSO, Bagging, Kanker Payudara. |
Subjects: | T Technology > Information and Computer |
Fakultas: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1 |
Depositing User: | S.Hum Maria Ayu |
Date Deposited: | 30 Aug 2020 16:16 |
Last Modified: | 30 Aug 2020 17:17 |
URI: | http://lib.unnes.ac.id/id/eprint/38449 |
Actions (login required)
View Item |