PENERAPAN K-NEAREST NEIGHBORS DENGAN TERM FREQUENCY–INVERSE DOCUMENT FREQUENCY DAN INFORMATION GAIN UNTUK KLASIFIKASI IDE BUNUH DIRI PADA PENGGUNA TWITTER


Rizal Maulana, 4611416036 (2021) PENERAPAN K-NEAREST NEIGHBORS DENGAN TERM FREQUENCY–INVERSE DOCUMENT FREQUENCY DAN INFORMATION GAIN UNTUK KLASIFIKASI IDE BUNUH DIRI PADA PENGGUNA TWITTER. Under Graduates thesis, Universitas Negeri Semarang.

[thumbnail of 4611416036 - RIZAL MAULANA.pdf] PDF - Published Version
Restricted to Repository staff only

Download (3MB) | Request a copy

Abstract

Zaman modern sekarang media sosial menjadi alat komunikasi paling populer. Salah satu media sosial paling banyak digunakan adalah Twitter. Pada tahun 2020 terdapat 166 juta pengguna aktif. Twitter menjadi media mencurahkan pikiran lewat tweet. Sehingga data dari Twitter dapat digunakan untuk analisis sentimen ide bunuh diri. Analisis sentimen adalah salah satu cabang ilmu data mining yang digunakan untuk mengolah data teks dan untuk data mining tersebut biasa digunakan metode klasifikasi. Penelitian ini dilakukan untuk mencari hasil akurasi yang dihasilkan dari metode klasifikasi dengan menambahkan metode lainnya untuk menghasilkan akurasi yang lebih optimal. Salah satu metode klasifikasi yang paling banyak digunakan adalah K-Nearest Neighbour. K-Nearest Neighbour digunakan karena memiliki keunggulan untuk digunakan dalam jumlah data training yag besar dan data yang banyak terdapat noisy. Namun dalam penrapannya K-Nearest Neighbour harus menentukan nilai K untuk mendapatkan hasil yang paling optimal. Pada penelitian ini juga menerapkan Information Gain sebagai features selection dan Term Frequency-Inverse Dovument Frequency sebagai word vectorization guna mengoptimalkan hasil dari klasifikasi menggunakan metode K-Nearest Neighbour pada data ide bunuh diri di Twitter. Pengujian diterapkan pada 1937 data dalam bentuk tweet yang berlabel positif atau negatif. Hasil dari pengujian menggunakan klasifikasi K-Nearest Neighbour dengan menerapkan Term Frequency-Inverse Document Frequency dan Information Gain adalah 88,66% mendapatkan peningkatan sebesar 0,9% dibandingkan dengan pengujian menggunakan klasifikasi K-Nearest Neighbour saja

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Text Mining, Klasifikasi, K-Nearest Neighbour, Information Gain, Term Frequency-Inverse Document Frequency, Ide Bunuh Diri
Subjects: T Technology > Information and Computer
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: TUKP unnes
Date Deposited: 11 Jul 2022 07:12
Last Modified: 11 Jul 2022 07:12
URI: http://lib.unnes.ac.id/id/eprint/50156

Actions (login required)

View Item View Item