PENERAPAN SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) TERHADAP ANALISIS SENTIMEN DATA REVIEW PENGGUNA APLIKASI MARKETPLACE SHOPEE DAN TOKOPEDIA PADA SITUS GOOGLE PLAY
Meishita Inelza Putri, 4112318018 (2021) PENERAPAN SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) TERHADAP ANALISIS SENTIMEN DATA REVIEW PENGGUNA APLIKASI MARKETPLACE SHOPEE DAN TOKOPEDIA PADA SITUS GOOGLE PLAY. Under Graduates thesis, Universitas Negeri Semarang.
PDF
- Published Version
Restricted to Repository staff only Download (6MB) | Request a copy |
Abstract
Pertumbuhan e-commerce sangat pesat di Indonesia dilihat dari data pengguna internet yang terus meningkat ditambah adanya pandemi virus COVID�19 yang mengharuskan masyarakat melakukan social distancing. Penyedia e�commerce yang umum digunakan oleh masyarakat Indonesia terutama generasi milenial adalah Shopee dan Tokopedia. Suatu aplikasi tidak lepas dari review pengguna, dalam proses mengumpulkan maupun menyortir review tersebut digunakan teknik web scraping. Review pengguna tersebut nantinya akan dibedakan menjadi sentimen positif dan negatif. Namun review tersebut hanya berupa teks tanpa arti tertentu, untuk itu diperlukan analisis yang dapat mengklasifikasikan review sebagai sentimen pengguna dengan menggunakan text mining. Penelitian tentang analisis sentimen sering kali muncul permasalahan data review cenderung imbalanced datasets maka digunakan teknik SMOTE (Synthetic Minority Oversampling Technique) untuk penanganan imbalanced dataset. Data yang diperoleh dari situs Google Play selanjutnya dilakukan pembobotan TF-IDF, pelabelan menggunakan VADER Lexicon, dan dianalisis dengan metode klasifikasi SVM, Naïve Bayes, Logistic Regression, Random Forest, Decision Tree, dan k-NN untuk mengklasifikasikan review berdasarkan kategori positif dan negatif. Penggunaan SMOTE menunjukkan dapat menaikkan tingkat akurasi nilai AUC model pada data tidak seimbang dan hal tersebut menunjukkan model dengan SMOTE lebih akurat dibandingkan dengan model tanpa SMOTE. Metode klasifikasi yang cocok digunakan untuk klasifikasi review pengguna Shopee adalah SVM, sedangkan untuk Tokopedia adalah Random Forest dengan SMOTE karena memiliki nilai AUC paling tinggi
Item Type: | Thesis (Under Graduates) |
---|---|
Uncontrolled Keywords: | SMOTE, Analisis Sentimen, Supervised Learning, Text Mining, VADER Lexicon, TF-IDF, Shopee, Tokopedia. |
Subjects: | H Social Sciences > HC Economic History and Conditions |
Fakultas: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika, S1 |
Depositing User: | TUKP unnes |
Date Deposited: | 13 Dec 2022 07:54 |
Last Modified: | 13 Dec 2022 07:54 |
URI: | http://lib.unnes.ac.id/id/eprint/54165 |
Actions (login required)
View Item |