PEMODELAN TOPIK PADA ULASAN PENGGUNA APLIKASI WHATSAPP MENGGUNAKAN LATENT DIRICHLET ALLOCATION (LDA)


Hera Masri’an, 4111416029 (2022) PEMODELAN TOPIK PADA ULASAN PENGGUNA APLIKASI WHATSAPP MENGGUNAKAN LATENT DIRICHLET ALLOCATION (LDA). Under Graduates thesis, UNIVERSITAS NEGERI SEMARANG.

[thumbnail of 4111416029 - Hera Masri`an.pdf] PDF - Published Version
Restricted to Repository staff only

Download (7MB) | Request a copy

Abstract

Ulasan pengguna memuat informasi penting bagi pihak pengembang suatu produk terkait. Hal yang dibahas dalam ulasan sangat beragam, sehingga perlu dilakukan topic modeling untuk membantu ekstraksi informasi. Algoritma topic modeling berguna untuk menemukan tema atau topik pada kumpulan data teks. Mempelajari kumpulan teks berdasarkan topik dapat memberikan pemahaman yang lebih baik terhadap isi data. Tujuan penelitian ini adalah melakukan pemodelan topik pada ulasan pengguna aplikasi WhatsApp menggunakan Latent Dirichlet Allocation (LDA). LDA merupakan teknik topic modeling yang memanfaatkan suatu model generatif probabilistik untuk mengelompokkan data teks berdasarkan topik, di mana setiap item tidak hanya berada pada satu topik, tetapi mempunyai probabilitas keanggotaan terhadap beberapa topik. Penelitian ini dilakukan dengan metode kualitatif yang terdiri dari lima tahapan, yaitu identifikasi masalah, pengambilan data, prapemrosesan (preprocessing), pemodelan, dan analisis hasil. Preprocessing data meliputi remove punctuation, remove number, lowercase, lemmatization/stemming, remove stopword, dan strip white space. Sementara itu, tahap pemodelan terdiri dari pembuatan Document�Term Matrix (DTM), penentuan banyak iterasi dan topik, dilanjutkan dengan pembentukan model. Indikator dalam penentuan banyak iterasi dan topik adalah nilai perplexity. Nilai perplexity yang rendah menandakan kinerja model yang lebih baik. Dari percobaan, diperoleh banyak iterasi 300 dan banyak topik 31. Proses pemodelan menghasilkan word-topic assignment dan document-topic assignment. Dari word-topic assignment dapat diketahui top terms, yaitu kata-kata yang memiliki probabilitas tinggi pada masing-masing topik. Sementara itu, dari document-topic assignment diperoleh top documents, yaitu dokumen-dokumen yang memiliki probabilitas tinggi pada masing-masing topik. Berdasarkan hasil analisis lebih lanjut terhadap top terms dan top documents, telah dirumuskan deskripsi untuk masing-masing topik berupa label atau judul topik. Secara garis besar, topik yang dibahas adalah tentang fitur panggilan (suara dan video), multimedia (foto, kamera, dokumen), pesan (grup, pesan suara, stiker), penyimpanan data, dan masalah keamanan. Topik yang paling sering dibahas adalah tentang panggilan, yaitu suara dan video (topik ke-9) sebanyak 104 ulasan, serta kualitas panggilan (topik ke-11) sebanyak 86 ulasan. Pada topik lain, ada 100 ulasan yang menyinggung masalah kualitas pesan media, seperti foto dan video (topik ke-2), serta pesan suara (topik ke-16) sebanyak 75 ulasan.

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Text Mining, Topic Modeling, Latent Dirichlet Allocation, Ulasan Pengguna
Subjects: Q Science > QA Mathematics
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika, S1
Depositing User: TUKP unnes
Date Deposited: 13 Dec 2024 03:39
Last Modified: 13 Dec 2024 03:39
URI: http://lib.unnes.ac.id/id/eprint/66251

Actions (login required)

View Item View Item