Penerapan Algoritma C4.5 Menggunakan TF-IDF dan N-Gram untuk Prediksi Email Spam


Bharaka Zulfa Maraghi, 4611419062 (2023) Penerapan Algoritma C4.5 Menggunakan TF-IDF dan N-Gram untuk Prediksi Email Spam. Under Graduates thesis, UNNES.

[thumbnail of (COVER - DAFTAR ISI) SKRIPSI_4611419062_Bharaka_Zulfa_Maraghi.pdf] PDF
Download (520kB)
[thumbnail of SKRIPSI_4611419062_Bharaka_Zulfa_Maraghi.pdf] PDF
Restricted to Repository staff only

Download (3MB) | Request a copy
[thumbnail of signed_skdosbing_4611419062_1685341478.pdf-doc-647445f8f1787.pdf] PDF
Download (237kB)
[thumbnail of BERITA ACARA.pdf] PDF
Download (550kB)
[thumbnail of NOTA BUKU.pdf] PDF
Download (23MB)
[thumbnail of (article) Bharaka Zulfa Maraghi - 4611419062.pdf] PDF
Restricted to Repository staff only

Download (479kB) | Request a copy

Abstract

Maraghi, Bharaka Z. 2023. Penerapan Algoritma C4.5 Menggunakan TF-IDF dan N-Gram untuk Prediksi Email Spam. Skripsi, Program Studi Teknik Informatika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang. Pembimbing Aji Purwinarko, S.Si., M.Cs. Kata kunci: klasifikasi teks, email spam, machine learning, C4.5, TF-IDF, N-gram Email adalah sarana komunikasi populer dalam jaringan internet karena kemudahan dan kecepatan penggunaannya. Namun, penyalahgunaan email seperti email spam dapat merugikan orang lain dan mengganggu penggunaan email secara efisien. Email spam berisi konten iklan, penipuan, dan virus yang dikirim oleh pengguna yang tidak diminta, yang dapat menyebabkan pemborosan waktu, penyimpanan server email, dan bandwidth. Dalam penanganan masalah email spam, teknologi text mining dapat digunakan untuk mengenali email spam dengan lebih efisien dan akurat. Penelitian ini bertujuan untuk mengimplementasikan algoritma C4.5 dengan menerapkan metode TF-IDF dan N-gram dalam melakukan prediksi email spam. Penggunaan TF-IDF digunakan untuk merepresentasikan teks email menjadi representasi numerik, sementara analisis N-gram digunakan untuk memahami pola dan hubungan antar kata-kata dalam teks. Penelitian dilakukan dengan menggunakan dataset Ling-Spam Dataset. Hasil penelitian menunjukkan bahwa penerapan algoritma C4.5 dengan TF-IDF dan N-gram berhasil mencapai 97,92% untuk akurasi, 100% untuk presisi, dan 95,83% untuk recall dalam prediksi email spam. Penggabungan metode TF-IDF dan N-gram memberikan kemampuan lebih baik dalam mengenali pola khusus dari email spam, sehingga meningkatkan kualitas prediksi. Hasil dari penelitian ini menunjukkan potensi penggunaan TF-IDF dan N-gram dalam meningkatkan kualitas prediksi email spam. Penelitian ini memberikan kontribusi penting dalam pengembangan sistem prediksi email spam yang lebih handal dan efisien, dengan tujuan melindungi pengguna dari ancaman email spam yang berbahaya.

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: klasifikasi teks, email spam, machine learning, C4.5, TF-IDF, N-gram
Subjects: L Education > L Education (General)
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: Mahasiswa FMIPA
Date Deposited: 02 Oct 2023 02:34
Last Modified: 02 Oct 2023 02:34
URI: http://lib.unnes.ac.id/id/eprint/60194

Actions (login required)

View Item View Item