OPTIMASI NAÏVE BAYES CLASSIFIER MENGGUNAKAN CHI-SQUARE DAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY UNTUK ANALISIS SENTIMEN REVIEW AMAZON


Anisa Falasari, 4611416034 (2020) OPTIMASI NAÏVE BAYES CLASSIFIER MENGGUNAKAN CHI-SQUARE DAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY UNTUK ANALISIS SENTIMEN REVIEW AMAZON. Under Graduates thesis, Universitas Negeri Semarang.

[thumbnail of 4611416034 - Anisa Falasari.pdf] PDF - Published Version
Restricted to Repository staff only

Download (2MB) | Request a copy

Abstract

Perkembangan internet yang semakin pesat, membuat informasi mengalir secara cepat yang berdampak pada dunia perdagangan. Beberapa orang yang sudah pernah membeli sebuah produk akan menuliskan opininya pada media sosial atau situs online lainnya. Review pembeli yang berupa teks panjang memerlukan mesin untuk mengenali opini. Analisis sentimen menerapkan metode text mining. Salah satu penerapan metode yang dapat diterapkan dalam analisis sentimen adalah klasifikasi. Salah satu algortima klasifikasi adalah naïve bayes classifier. Naïve bayes classifier merupakan metode klasifikasi dengan efisiensi dan kinerja cukup baik. Namun, sangat sensitif dengan feature yang terlalu banyak sehingga membuat akurasi rendah. Untuk meningkatkan akurasi algoritma naïve bayes classifier dapat dilakukan dengan pemilihan feature. Salah satu teknik dalam pemilihan feature yaitu chi-square digunakan untuk menguji indepndensi dua peristiwa. Pemilihan feature dengan perhitungan chi-square berdasarkan nilai top-K. Selain itu, pembobotan feature juga dapat meningkatkan akurasi algoritma. Salah satu teknik pembobotan feature yaitu term frequency inverse document frequency (TF-IDF). Dalam penelitian ini menggunakan sentiment labelled dataset (field Amazon_labelled) yang diambil dari UCI Machine Learning. Dataset ini memiliki 500 review positif dan 500 review negatif. Akurasi naïve bayes classifier dalam analisis sentimen review Amazon adalah 82%. Sedangkan, akurasi naïve bayes classifier dengan menerapkan chi-square dan TF-IDF adalah 83%

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Naïve Bayes Classifier, Chi-square, Term Frequency Inverse Document Frequency, Review Amazon
Subjects: T Technology > Information and Computer
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: TUKP unnes
Date Deposited: 04 Jul 2022 08:35
Last Modified: 04 Jul 2022 08:35
URI: http://lib.unnes.ac.id/id/eprint/50022

Actions (login required)

View Item View Item