KOMPARASI ALGORITMA SELEKSI FITUR PRINCIPAL COMPONENT ANALYSIS (PCA) DAN INFORMATION GAIN DALAM DIAGNOSIS PENYAKIT PARKINSON MENGGUNAKAN NAIVE BAYES


Punggi Trimas Agustina, 4611417044 (2022) KOMPARASI ALGORITMA SELEKSI FITUR PRINCIPAL COMPONENT ANALYSIS (PCA) DAN INFORMATION GAIN DALAM DIAGNOSIS PENYAKIT PARKINSON MENGGUNAKAN NAIVE BAYES. Under Graduates thesis, Universitas Negeri Semarang.

[thumbnail of Skripsi] PDF (Skripsi)
Restricted to Repository staff only

Download (2MB) | Request a copy

Abstract

Perkembangan teknologi informasi membantu dalam mengolah data menjadi sebuah infomasi yang berkualitas tinggi. Salah satu teknik pengolahan data yang banyak dimanfaatkan oleh berbagai kalangan yaitu data mining, yang mana salah satu jenisnya adalah klasifikasi. Pemanfaatan klasifikasi dalam mengolah data dimanfaatkan dalam berbagai bidang salah satunya untuk keperluan diagnosis penyakit dalam bidang medis. Dikutip dari Badan Pusat Statistik (BPS) pada tahun 2015, diperkirakan terdapat 200.000 orang pengidap penyakit parkinson diantara 20 juta penduduk, dengan 547 kasus baru setiap harinya. Penyakit parkinson sendiri merupakan gangguan neurodegeneratif yang ditandai dengan tiga gejala utama yaitu tremor saat istirahat, tubuh terasa kaku serta bradikinesia (kecenderungan melambat). Dalam penelitian ini, algoritma Naive Bayes digunakan untuk mendiagosis penyakit parkinson. Keakuratan algoritma Naive Bayes dipengaruhi oleh penggunaan fitur dalam dataset. Metode pemilihan fitur dengan PCA dan information gain diterapkan untuk mengurangi fitur yang tidak relevan sehingga dapat meningkatkan hasil akurasi. Tujuan dari penelitian ini adalah untuk mengkomparasi algoritma seleksi fitur mana yang terbaik diantara PCA dan information gain yang dapat memberikan akurasi yang lebih tinggi pada algoritma naive bayes dalam diagnosis penyakit parkinson. Pada penelitian ini, dataset penyakit parkinson yang digunakan diambil dari UCI Machine Learning Repository. Dataset penyakit parkinson mempunyai 195 populasi dan 23 atribut. Algoritma PCA memilih 5 komponen PC terbaik sedangkan algoritma information gain mereduksi fitur menjadi 4. Setelah masing-masing dataset melalui seleksi fitur menggunakan PCA atau information gain, proses selanjutnya adalah klasifikasi menggunakan Naive Bayes. Hasil klasifikasi kemudian dihitung menggunakan confussion matrix. Akurasi terbaik yang dihasilkan dari Naive Bayes menggunakan PCA adalah sebesar 89,74%, dan akurasi terbaik yang dihasilkan dari naive bayes menggunakan information gain adalah sebesar 94,87%. Sedangkan akurasi terbaik yang dihasilkan oleh Naive Bayes tanpa menggunakan seleksi fitur adalah sebesar 79,49%. Hal ini menunjukkan bahwa information gain memberikan peningkatan akurasi terbaik pada algoritma Naive Bayes dalam diagnosis penyakit parkinson.

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Data Mining, Seleksi Fitur, Penyakit Parkinson, Principal Component Analysis (PCA), Information Gain, Naive Bayes
Subjects: Q Science > Q Science (General)
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: Setyarini UPT Perpus
Date Deposited: 30 Jan 2024 08:26
Last Modified: 30 Jan 2024 08:26
URI: http://lib.unnes.ac.id/id/eprint/61696

Actions (login required)

View Item View Item