Penerapan Algoritma C4.5 Menggunakan TF-IDF dan N-Gram untuk Prediksi Email Spam
Bharaka Zulfa Maraghi, 4611419062 (2023) Penerapan Algoritma C4.5 Menggunakan TF-IDF dan N-Gram untuk Prediksi Email Spam. Under Graduates thesis, UNNES.
![]() |
PDF
Download (520kB) |
![]() |
PDF
Restricted to Repository staff only Download (3MB) | Request a copy |
![]() |
PDF
Download (237kB) |
![]() |
PDF
Download (550kB) |
![]() |
PDF
Download (23MB) |
![]() |
PDF
Restricted to Repository staff only Download (479kB) | Request a copy |
Abstract
Maraghi, Bharaka Z. 2023. Penerapan Algoritma C4.5 Menggunakan TF-IDF dan N-Gram untuk Prediksi Email Spam. Skripsi, Program Studi Teknik Informatika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang. Pembimbing Aji Purwinarko, S.Si., M.Cs. Kata kunci: klasifikasi teks, email spam, machine learning, C4.5, TF-IDF, N-gram Email adalah sarana komunikasi populer dalam jaringan internet karena kemudahan dan kecepatan penggunaannya. Namun, penyalahgunaan email seperti email spam dapat merugikan orang lain dan mengganggu penggunaan email secara efisien. Email spam berisi konten iklan, penipuan, dan virus yang dikirim oleh pengguna yang tidak diminta, yang dapat menyebabkan pemborosan waktu, penyimpanan server email, dan bandwidth. Dalam penanganan masalah email spam, teknologi text mining dapat digunakan untuk mengenali email spam dengan lebih efisien dan akurat. Penelitian ini bertujuan untuk mengimplementasikan algoritma C4.5 dengan menerapkan metode TF-IDF dan N-gram dalam melakukan prediksi email spam. Penggunaan TF-IDF digunakan untuk merepresentasikan teks email menjadi representasi numerik, sementara analisis N-gram digunakan untuk memahami pola dan hubungan antar kata-kata dalam teks. Penelitian dilakukan dengan menggunakan dataset Ling-Spam Dataset. Hasil penelitian menunjukkan bahwa penerapan algoritma C4.5 dengan TF-IDF dan N-gram berhasil mencapai 97,92% untuk akurasi, 100% untuk presisi, dan 95,83% untuk recall dalam prediksi email spam. Penggabungan metode TF-IDF dan N-gram memberikan kemampuan lebih baik dalam mengenali pola khusus dari email spam, sehingga meningkatkan kualitas prediksi. Hasil dari penelitian ini menunjukkan potensi penggunaan TF-IDF dan N-gram dalam meningkatkan kualitas prediksi email spam. Penelitian ini memberikan kontribusi penting dalam pengembangan sistem prediksi email spam yang lebih handal dan efisien, dengan tujuan melindungi pengguna dari ancaman email spam yang berbahaya.
Item Type: | Thesis (Under Graduates) |
---|---|
Uncontrolled Keywords: | klasifikasi teks, email spam, machine learning, C4.5, TF-IDF, N-gram |
Subjects: | L Education > L Education (General) |
Fakultas: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1 |
Depositing User: | Mahasiswa FMIPA |
Date Deposited: | 02 Oct 2023 02:34 |
Last Modified: | 02 Oct 2023 02:34 |
URI: | http://lib.unnes.ac.id/id/eprint/60194 |
Actions (login required)
![]() |
View Item |