ANALISIS DAN DETEKSI HATE SPEECH PADA PENGGUNA TWITTER BERBASIS SENTIMENT ANALYSIS MENGGUNAKAN MODEL HYBRID N-GRAM DAN DECISION TREE


Rizqia Lutfi Kurnia Dewi, 4611416079 (2020) ANALISIS DAN DETEKSI HATE SPEECH PADA PENGGUNA TWITTER BERBASIS SENTIMENT ANALYSIS MENGGUNAKAN MODEL HYBRID N-GRAM DAN DECISION TREE. Under Graduates thesis, Universitas Negeri Semarang.

[thumbnail of ANALISIS DAN DETEKSI HATE SPEECH PADA PENGGUNA TWITTER BERBASIS SENTIMENT ANALYSIS MENGGUNAKAN MODEL HYBRID N-GRAM DAN DECISION TREE] PDF (ANALISIS DAN DETEKSI HATE SPEECH PADA PENGGUNA TWITTER BERBASIS SENTIMENT ANALYSIS MENGGUNAKAN MODEL HYBRID N-GRAM DAN DECISION TREE) - Published Version
Restricted to Repository staff only

Download (3MB) | Request a copy

Abstract

Media sosial telah menjadi sebuah teknologi yang hampir digunakan semua kalangan masyarakat sebagai media informasi dan komunikasi, salah satunya Twitter. Twitter sendiri tidak lepas dari banyaknya ujaran kebencian atau hate speech didalamnya, baik yang tertuju ke perorangan maupun kelompok. Maka permasalahan yang muncul adalah bagaimana suatu sistem dapat mendeteksi apakah sebuah tweet mengandung hate speech atau tidak. Pada penelitian ini, diimplementasikan metode hibridisasi unigram, bigram, dan trigram yang kemudian disebut dengan Hybrid N-gram untuk melakukan ekstraksi fitur pada sebuah tweet. Fitur tersebut akan diklasifikasikan menggunakan Decision Tree untuk mendeteksi apakah tweet tersebut mengandung hate speech atau tidak. Dataset yang digunakan diambil dari Twitter secara realtime melalui Twitter API menggunakan keyword yang berhubungan dengak topik Pilkada 2020 pada bulan September hingga Oktober. Hasil dari penelitian ini membuktikan bahwa dari 1000 tweet yang sudah diambil, meliputi 505 tweet bukan hate speech dan 495 tweet hate speech yang telah dikumpulkan, dihasilkan tingkat akurasi F-score terbaik sebesar 0.94 pada perbandingan pembagian data 10:90 untuk data uji dan data latih. Dari hasil tersebut dapat diambil kesimpulan bahwa metode hibridisasi unigram, bigram, dan trigram dengan metode klasifikasi Decision Tree memberikan hasil yang cukup baik dalam mengklasifikasikan tweet ke dalam hate speech dan bukan.

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Analisis Sentimen, Decision Tree, Hybrid N-gram
Subjects: T Technology > Information and Computer
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: indah tri pujiati
Date Deposited: 07 Sep 2021 06:43
Last Modified: 07 Sep 2021 06:43
URI: http://lib.unnes.ac.id/id/eprint/45648

Actions (login required)

View Item View Item