PENGENALAN KARAKTER TULISAN TANGAN ARAB PADA CITRA MENGGUNAKAN RESCALING DAN TESSERACT OCR BERBASIS LONG SHORT TERM MEMORY


Timur Gagah Prawiro, 4611416015 (2021) PENGENALAN KARAKTER TULISAN TANGAN ARAB PADA CITRA MENGGUNAKAN RESCALING DAN TESSERACT OCR BERBASIS LONG SHORT TERM MEMORY. Under Graduates thesis, UNIVERSITAS NEGERI SEMARANG.

[thumbnail of 4611416015 - Timur Gagah Prawiro.pdf] PDF - Published Version
Restricted to Repository staff only

Download (2MB) | Request a copy

Abstract

Perkembangan teknologi informasi berdampak pada kehidupan sehari-hari, salah satu perkembangan tersebut yakni komputer dapat mengenali citra karakter tulisan tangan manusia menjadi bentuk karakter komputer dengan memanfaatkan teknologi optical character recognition (OCR). Namun, dalam konteks pengenalan karakter tulisan tangan, karakter Arab memiliki sifat kursif dan kesulitan yang relatif tinggi, dan pengembangan aplikasi pengenalan karakter Arab pada citra belum banyak. Salah satu framework populer untuk pengembangan pengenalan karakter adalah Tesseract OCR sebagai framework OCR populer yang bersifat open source dan akurat. Tesseract OCR dapat melalui penggunaan improvisasi dengan teknik pengolahan citra agar mendapatkan output yang lebih akurat, seperti melakukan scaling/rescaling pada citra, sehingga penelitian ini bertujuan untuk mengetahui pengaruh rescaling terhadap performa Tesseract OCR dalam pengenalan karakter tulisan tangan Arab. Metode yang diusulkan dalam penelitian ini adalah rescaling nearest neighbor sebagai preprocessing dan Tesseract OCR versi 4 yang telah terbarukan dengan Long Short Term Memory (LSTM) dan dapat menggunakan citra serta transkrip teks sebagai data latih. Hasil penelitian ini menunjukkan bahwa rescaling dalam pengenalan karakter tulisan tangan Arab dengan Tesseract OCR berbasis Long Short Term Memory memberikan dampak berupa peningkatan akurasi kisaran 3%, serta mencapai akurasi sebesar 73,83% dengan implementasi kamus. Pengembangan lanjutan menggunakan metode pengolahan citra lain dengan memanfaatkan Tesseract OCR masih berpeluang besar.

Item Type: Thesis (Under Graduates)
Uncontrolled Keywords: Pengenalan Karakter Tulisan Tangan, Karakter Arab, Tesseract OCR, Rescaling, Long Short Term Memory.
Subjects: Q Science > Q Science (General)
T Technology > Information and Computer
T Technology > Computer Engineering
Fakultas: Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer, S1
Depositing User: Setyarini UPT Perpus
Date Deposited: 14 Nov 2024 03:59
Last Modified: 14 Nov 2024 03:59
URI: http://lib.unnes.ac.id/id/eprint/65556

Actions (login required)

View Item View Item