OPTIMASI ALGORITMA SUPPORT VECTOR MACHINE MENGGUNAKAN LINEAR DISCRIMINANT ANALYSIS DAN INFORMATION GAIN UNTUK IDENTIFIKASI FAKE ACCOUNT DI TWITTER
Dwi Nur Maulidayanti, 4611418031 (2022) OPTIMASI ALGORITMA SUPPORT VECTOR MACHINE MENGGUNAKAN LINEAR DISCRIMINANT ANALYSIS DAN INFORMATION GAIN UNTUK IDENTIFIKASI FAKE ACCOUNT DI TWITTER. Under Graduates thesis, Universitas Negeri Semarang.
PDF
- Published Version
Restricted to Repository staff only Download (4MB) | Request a copy |
Abstract
Twitter merupakan salah satu platform popular yang digunakan masyarakat dalam bersosial media di jagat internet. Fitur utama Twitter ialah microblogging sebagai sarana publikasi sehingga informasi yang disampaikan menjadi lebih cepat tersebar karena berbasis kata. Kenyamanan dan keamanan pengguna dalam melakukan aktivitas pengguna sosial media Twitter menjadi salah satu prioritas pihak Twitter. Munculnya fake account di antara pengguna aktif menjadi salah satu permasalahan yang dihadapi di berbagai platform sosial media, termasuk di Twitter. Fake account dapat menyembunyikan pengguna yang melakukan tindakan ilegal, memperumit autentikasi akun, mengubah karakteristik audience, masalah legitimasi pengguna, dan mengganggu finansial perusahaan Twitter. Dengan memaksimalkan sistem identifikasi fake account di Twitter menjadi salah satu langkah antisipasi dalam menghadapi dampak permasalahan fake account. Algoritma support vector machine diusulkan karena pendekatannya yang baik dalam melakukan klasifikasi di berbagai penelitian lainnya. Support vector machine akan melakukan identifikasi sejumlah data yang telah dikumpulkan secara langsung menggunakan teknik crawling di Twitter dan berhasil mengumpulkan 2000 data dari berbagai pengguna yang mengunggah tweet dengan tagar ‘covid’ selama 6 bulan terakhir. Pemrosesan support vector machine sangat bergantung pada atribut yang digunakan selama perhitungan, sehingga untuk mendapatkan atribut yang tepat diterapkannya information gain sebagai metode seleksi fitur dan metode linear discriminant analysis sebagai ekstraksi fitur pada data. Proses information gain berguna untuk membuang atribut yang tidak berguna dalam meningkatkan kinerja dari support vector machine sehingga akan meringankan komputasi tanpa menghilangkan atribut yang penting. Metode linear discriminant analysis mampu mengurangi dimensi dari keseluruhan atribut ke bentuk kombinasi linear yang mencakup bobot pentingnya atribut. Berdasarkan hasil penelitian, algoritma support vector machine dapat meningkatkan keakuratan hingga 32,77% dengan akurasi awal sebesar 56,26% menjadi 89,03% melalui penerapan linear discriminant analysis dan information gain. Penelitian ini diharapkan mampu menjadi referensi bagi pengembangan lebih lanjut untuk mengidentifikasi fake account di Twitter dengan mendalami tahap optimasi dan pemilihan atribut pada kumpulan data. Data dan atribut yang dikumpulkan pada penelitian ini memiliki keterbatasan akses sehingga data yang didapatkan kurang maksimal. Diharapkan juga penelitian selanjutnya memperhatikan proses labeling yang tepat dan pembuangan outlier pada data karena mempengaruhi kinerja model.
Item Type: | Thesis (Under Graduates) |
---|---|
Uncontrolled Keywords: | Identifikasi, support vector machine, information gain, linear discriminant analysis, fake account, Twitter |
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Fakultas: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1 |
Depositing User: | TUKP unnes |
Date Deposited: | 29 Mar 2023 04:19 |
Last Modified: | 29 Mar 2023 04:19 |
URI: | http://lib.unnes.ac.id/id/eprint/56797 |
Actions (login required)
View Item |