PENGIMPLEMENTASIAN OCR MENGGUNAKAN CNN UNTUK EKSTRAKSI TEKS PADA GAMBAR

Ivan Wijaya; Chairisni Lubis

doi:10.24912/jiksi.v10i1.17836

PDF

DOI: https://doi.org/10.24912/jiksi.v10i1.17836

Keywords:

CNN, Text Detection, Text Recognition, Python

Dimensions

Altmetrics

Statistics

Read Counter : 1117

Download : 848

Crossmark/ Data Version

Ivan Wijaya

Chairisni Lubis

Abstract

OCR merupakan sebuah sistem yang digunakan untuk mengekstraksi tulisan yang terdapat pada sebuah gambar sehingga dapat mempercepat proses input data. Sistem OCR merupakan sebuah sistem yang terdiri dari 2 proses yaitu pendeteksian teks dan pengenalan teks. Pada perancangan ini, digunakan 2 model CNN untuk melakukan pendeteksian dan pengenalan teks. Digunakan CNN dengan struktur Feature Pyramid Network yang menggunakan Backbone VGG19 untuk mendeteksi lokasi teks pada gambar. Untuk mengenali teks pada gambar akan digunakan CNN dengan LSTM untuk melakukan pengenalan teks pada area gambar yang telah terdeteksi. Kedua CNN dilatih ddengan menggunakan dataset ICDAR 2015, COCO-Text, dan ICDAR 2019. Pada akhir pelatihan, didapatkan model pendeteksian teks dengan besaran F1-Score sebesar 49.18%, dan model pengenalan teks dengan besar Correctly Recognized Word sebesar 55.80%

Issue

Vol. 10 No. 1 (2022): JURNAL ILMU KOMPUTER DAN SISTEM INFORMASI

Section

Articles

This work is licensed under a Jurnal Komunikasi Creative Commons Attribution-ShareAlike 4.0 International License.

References

Heravi, Einaz J.; and Aghdam, Hamed H. 2017, ”Guide to convolutional neural networks: a practical application to traffic-sign detection and classification”, Springer, Berlin.

Hochreiter, Sepp; and Schmidhuber, Jürgen. “Neural Computation: Long short-term memory”, https://www.researchgate.net/publication/13853244_Long_Short-term_Memory, 30 November 2021

Huber, Peter. ”Robust Estimation of a Location Parameter”. https://www.semanticscholar.org/paper/ Robust-Estimation-of-a-Location-Parameter-Huber/ e6bdbc325de48cbd24a04829f5ce33612513677f, 30 Agustus 2021

Lin, Tsung-Yi; Goyal, Priya; Girshick, Ross; He, Kaiming; and Dollár, Piotr. 2017, ”Feature Pyramid Networks for Object Detection”, 2017 IEEE Conference on Computer Vision and Pattern Recognition

Lin, Tsung-Yi; Goyal, Priya; Girshick, Ross B.; He, Kaiming; and Dollár, Piotr. 2017, ”Focal Loss for Dense Object Detection”, 2017 IEEE International Conference on Computer Vision

Liwicki, Marcus; Graves, Alex; Bunke, Horst; and Schmidhuber, Jürgen. “A novel approach to on-line handwriting recognition based on bidirectional long short-term memory networks”, https://people.idsia.ch/~juergen/ icdar_2007.pdf, 15 December 2021

McCulloch, Warren; and Pitts, Walter. “A Logical Calculus of Ideas Immanent in Nervous Activity”. https://www.cs.cmu.edu/~./epxing/Class/10715/reading/McCulloch.and. Pitts.pdf, 27 Agustus 2021

Russakovsky, Olga; Deng, Jia; Su, Hao; Krause, Jonathan; Satheesh, Sanjeev; Ma, Sean; Huang, Zhiheng; Karpathy, Andrej; Khosla, Aditya; Bernstein, Michael; C. Berg, Alexander; and Fei, Li Fei. “ImageNet Large Scale Visual Recognition Challenge 2014”, https://www.image-net.org/challenges/LSVRC/2014/index.php, 28 Agustus 2021

Schantz, Herbert F. 1982, “The history of OCR, optical character recognition”, Recognition Technologies Users Association, Manchester

Simonyan, Karen; and Zisserman, Andrew. “Very deep convolutional networks for large-scale image recognition”. https://arxiv.org/pdf/1409.1556.pdf, 28 Agustus 2021

Valueva, M.V.; Nagornov, N.N.; Lyakhov, P.A.; Valuev, G.V.; and Chervyakov, N.I. “Application of the residue number system to reduce hardware costs of the convolutional neural network implementation”, https://www.sciencedirect.com/science/article/abs/pii/S0378475420301580, 27 Agustus 2021

Venkatesan, Ragav; and Li, Baoxin. 2017, “Convolutional Neural Networks in Visual Computing: A Concise Guide”, CRC Press, Boca Raton

PENGIMPLEMENTASIAN OCR MENGGUNAKAN CNN UNTUK EKSTRAKSI TEKS PADA GAMBAR

Abstract

References

Most read articles by the same author(s)

Similar Articles

Similar Articles

KAJIAN TENTANG SISTEM PENGELOMPOKAN AIR MINERAL GELAS DENGAN METODE SIFT DAN CNN

PEMILIHAN CROSSOVER PADA ALGORITMA GENETIKA UNTUK PROGRAM APLIKASI PENGENALAN KARAKTER TULISAN TANGAN

ANALISIS EMOSI PADA TEKS BAHASA INDONESIA DENGAN METODE NEIGHBOUR-WEIGHTED K-NEAREST NEIGHBOUR

PENDETEKSIAN DAN PENGENALAN JENIS MOBIL MENGGUNAKAN ALGORITMA YOU ONLY LOOK ONCE DAN CONVOLUTIONAL NEURAL NETWORK

PENGENALAN TULISAN TANGAN DENGAN PERBAIKAN GORESAN MENGGUNAKAN INTERPOLASI BEZIER DAN SMOOTHING

KAJIAN TENTANG PENGENALAN KARAKTER MENGGUNAKAN SCALE-INVARIANT FEATURE TRANSFORM

PENDETEKSIAN PENGGUNAAN MASKER WAJAH DENGAN METODE CONVOLUTIONAL NEURAL NETWORK

PERANCANGAN APLIKASI SISTEM MANAJEMEN DOKUMEN DAN PENCARIAN TEKS DENGAN MENGGUNAKAN OPTICAL CHARACTER RECOGNITION(OCR)

PENGGUNAAN METODE COUNTING BLOOM FILTER PADA APLIKASI INTRUSION DETECTION SYSTEM PADA BASIS DATA

SISTEM PENGENALAN WAJAH DENGAN METODE 2D-PCA

Article Sidebar

Main Article Content

Abstract

Article Details

References

Most read articles by the same author(s)

Similar Articles