OPTIMASI AKURASI KLASIFIKASI MENGGUNAKAN K-MEANS DAN ALGORITMA GENETIKA DENGAN MENGINTEGRASIKAN ALGORITMA C4.5 UNTUK DIAGNOSIS KANKER PAYUDARA


Fachrizal Ahdy Andoyo, 4611415040 (2020) OPTIMASI AKURASI KLASIFIKASI MENGGUNAKAN K-MEANS DAN ALGORITMA GENETIKA DENGAN MENGINTEGRASIKAN ALGORITMA C4.5 UNTUK DIAGNOSIS KANKER PAYUDARA. Under Graduates thesis, Universitas Negeri Semarang.

[thumbnail of OPTIMASI AKURASI KLASIFIKASI MENGGUNAKAN K-MEANS DAN ALGORITMA GENETIKA DENGAN MENGINTEGRASIKAN ALGORITMA C4.5 UNTUK DIAGNOSIS KANKER PAYUDARA]
Preview
PDF (OPTIMASI AKURASI KLASIFIKASI MENGGUNAKAN K-MEANS DAN ALGORITMA GENETIKA DENGAN MENGINTEGRASIKAN ALGORITMA C4.5 UNTUK DIAGNOSIS KANKER PAYUDARA) - Submitted Version
Download (964kB) | Preview
Official URL: http://lib.unnes.ac.id/

Abstract

Andoyo, Fachrizal Ahdy. 2020. Optimasi Akurasi Klasifikasi Menggunakan K-Means dan Algoritma Genetika dengan Mengintegrasikan Algoritma C4.5 untuk Diagnosis Kanker Payudara. Skripsi, Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang. Pembimbing Riza Arifudin, S.Pd., M.Cs. Kata kunci: Data Mining, K-Means, Algoritma Genetika, Decision Tree, Algoritma C4.5, Wisconsin Diagnotic Breast Cancer. Perkembangan era teknologi jaman sekarang mengakibatkan data-data berkembang dengan cepat. Data mining adalah teknik yang digunakan untuk mengubah data menjadi informasi yang valid dan berguna. Data mining telah banyak digunakan dalam melakukan fungsi prediksi, contohnya dalam bidang ilmu kesehatan dan medis, data mining dapat memprediksi diagnosis penyakit berdasarkan data medis. Teknik data mining yang biasa digunakan mendiagnosis penyakit adalah teknik klasifikasi, dimana teknik ini dapat memprediksi sebuah keputusan dan menghasilkan sebuah akurasi yang tinggi. Pohon keputusan atau decision tree merupakan metode klasifikasi yang kuat dan terkenal dalam hal prediksi. Salah satu algoritma pohon keputusan adalah algoritma C4.5. Dalam penelitian ini, algoritma C4.5 dapat malakukan diagnosis terhadap kanker payudara karena memiliki struktur yang sederhana dan menghasilkan akurasi yang tinggi. Wisconsin Diagnotic Breast Cancer (WDBC) merupakan dataset publik yang diambil dari UCI Machine Learning Repository, dimana dataset ini memiliki 32 atribut dengan 569 sampel. Dataset ini memiliki tipe data kontinu dan berdimensi tinggi. Data yang kontinu serta memiliki dimensi tinggi membuat C4.5 membutuhkan waktu komputasi yang lama dan ruang penyimpanan yang besar sehingga mempengaruhi performa akurasi klasifikasi. Untuk menangani masalah tersebut, penerapan kombinasi K-Means dan Algoritma genetika dapat mempercepat kinerja klasifikasi dengan pembentukan cluster-cluster dan pemilihan fitur-fitur terbaik berdasarkan nilai fitness terbaik. Tujuan dari penelitian ini adalah meningkatkan akurasi algoritma C4.5 dengan kombinasi K-Means dan Algoritma Genetika sebagai fitur seleksi untuk mendiagnosis Kanker Payudara. Hasil penelitian ini merupakan perbandingan akurasi C4.5 sebelum dan sesudah diterapkan kombinasi K-Means dan Algoritma Genetika dalam mendiagnosis Kanker payudara. Akurasi C4.5 adalah 91,228%. Sedangkan, akurasi C4.5 setelah dioptimasi menggunakan K-Means dan Algoritma Genetika sebagai fitur seleksi adalah 94,824%. Dengan demikian, penerapan K-Means dan Algoritma Genetika pada algoritma C4.5 terbukti mampu meningkatkan hasil akurasi dalam mendiagnosis (WDBC) sebesar 3,596%.

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Data Mining, K-Means, Algoritma Genetika, Decision Tree, Algoritma C4.5, Wisconsin Diagnotic Breast Cancer.
Subjects: Q Science > QA Mathematics > Forcasting
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: S.S Eko Handoyo
Date Deposited: 29 Dec 2020 03:19
Last Modified: 29 Dec 2020 03:19
URI: http://lib.unnes.ac.id/id/eprint/42451

Actions (login required)

View Item View Item