IMPLEMENTASI SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) DAN TWO-PHASE MUTATION GREY WOLF OPTIMIZATION (TMGWO) PADA DETEKSI DINI PENYAKIT DIABETES DENGAN K-NEAREST NEIGHBORS (KNN)
Fathan Arsyadani, 4611418047 (2022) IMPLEMENTASI SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) DAN TWO-PHASE MUTATION GREY WOLF OPTIMIZATION (TMGWO) PADA DETEKSI DINI PENYAKIT DIABETES DENGAN K-NEAREST NEIGHBORS (KNN). Under Graduates thesis, Universitas Negeri Semarang.
PDF
- Published Version
Restricted to Repository staff only Download (4MB) | Request a copy |
Abstract
Diabetes merupakan sebuah penyakit yang menyerang sistem endokrin yang ditandai dengan tingginya kadar gula dalam darah. Menurut data yang dikumpulkan International Diabetes Federation (IDF), pada tahun 2017 diperkirakan terdapat 451 juta penderita diabetes di seluruh dunia. Jika tidak ditangani, jumlah tersebut diperkirakan akan naik hingga menjadi 693 juta jiwa pada tahun 2045. Diagnosis dini merupakan suatu cara yang dapat dilakukan untuk mencegah peningkatan jumlah penderita diabetes tersebut. Di era dimana teknologi telah berkembang pesat, diagnosis dini dapat dilakukan dengan metode machine learning dengan prinsip kerja klasifikasi. KNN merupakan salah satu algoritme yang dapat melakukan klasifikasi dengan cukup baik. Beberapa hal yang kerap menjadi masalah dalam melakukan klasifikasi adalah data berdimensi tinggi dan data dengan jumlah data antar kelas yang tidak seimbang. Pada penelitian ini, kedua hal tersebut diatasi dengan menerapkan TMGWO untuk melakukan seleksi fitur dan SMOTE untuk melakukan penyeimbangan data antar kelas. Penerapan TMGWO mampu memilih subset fitur yang hanya berjumlah 10 fitur dari total 16 fitur yang terdapat pada dataset. Selanjutnya, dataset yang hanya terdiri dari 10 fitur terpilih oleh TMGWO akan dibagi menjadi training dan testing data dengan 10-fold cross�validation dan selanjutnya pada training data akan dilakukan oversampling untuk menyeimbangkan data antar kelas dengan SMOTE. Berbeda dengan SMOTE yang biasanya menggunakan euclidean distance dalam menghitung jarak antar data, pada SMOTE yang digunakan pada penelitian ini akan digunakan modified euclidean distance yang ditunjukkan pada Persamaan 3.15. SMOTE mampu mengubah jumlah data yang semula memiliki rasio ±(38%:62%) menjadi 50%:50. Penerapan, TMGWO dan SMOTE tersebut mampu memberikan tingkat akurasi sebesar 98.85%. Angka tersebut mengalami peningkatan sebesar 1.93% dari yang semula 96.92% pada klasifikasi tanpa menerapkan SMOTE dan TMGWO serta 1.54% dari yang semula 97.31% pada klasifikasi dengan menerapkan SMOTE tanpa TMGWO.
Item Type: | Thesis (Under Graduates) |
---|---|
Uncontrolled Keywords: | Diabetes, GWO, Klasifikasi, KNN, SMOTE, TMGWO. |
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Fakultas: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1 |
Depositing User: | TUKP unnes |
Date Deposited: | 29 Mar 2023 04:28 |
Last Modified: | 29 Mar 2023 04:28 |
URI: | http://lib.unnes.ac.id/id/eprint/56800 |
Actions (login required)
View Item |