Kayıt Ol

Giriş


Şifremi Kaybettim

Şifreni mi unuttun? Lütfen e-mail adresinizi giriniz. Bir bağlantı alacaksınız ve e-posta yoluyla yeni bir şifre oluşturacaksınız.

Giriş


Kayıt Ol

Merhaba, kayıt formu üzerinden kayıt olabilirsiniz. Fakat sosyal medya ile kayıt olmanızı önermekteyiz.

Python ve OpenCV ile OCR (Optical Character Recognation) Part 2

Python ve OpenCV ile OCR (Optical Character Recognation) Part 2

İyi günler arkadaşlar . Önceki yazımızda linux dağıtımına , en yaygın açık kaynak OCR kütüphanelerinden olan Tesseract’ın kurulumu ve örnek uygulamalarından bahsetmiştik.

Bugün hızlıca tesseract kütüphanesini python uygulamasına import etme ve python uygulamamızla OCR işlemi yapmaya değineceğim.

Uygulamaya başlamadan önce pillow (forklanmış PIL)ve pytesseract(Tesseract ocr işlemleri için) modüllerini bilgisayarımıza kurmamız gerekiyor.

python_OCR.pyp isminde uygulama oluşturup kodlamaya başlayalım

Image sınıfı , üzerinde OCR işlemi yapılacak resmimizin PIl formatında yüklenmesi içindir. Bu işlem pytesseract kullanırken gereklidir

Kullanıcıdan  örnek resim yolunu aldığımız ve komut satırından parametrelerini aldığımız argument parse kodlarına geçelim

Kullanıcı -r parametresini girerek resmin yolunu belirtecektir. Required = True yaparak bu parametre girişini zorunlu kıldık

Kullanıcı eğer resim üzerinde ilave işlem yapmak isterse -i parametresini girecektir. Bu isteğe bağlıdır

Yukarıdaki kod bloğundan, resmimizi okuyup, grayscale işlemini yaptık . Ayrıca kullanıcının resmi üzerinde ilave işlem yapacağı durumların kodunu yazdık (-i parametresi)

eğer Kullanıcı resim üzerinde thresholding işlemini yapacaksa -i thresh, gürültü azaltma yapmak isterse -i blur parametresini girecek .

thresholding işlemlerinde thresh binary ve thresh otsu yöntemleri için http://docs.opencv.org/trunk/d7/d4d/tutorial_py_thresholding.html linkini inceleyebilirsiniz

 

tesseract kütüphanesini , yalın kullanıldığından arka planı gürültülü olan resimlerin text çıktısında eksik ya da hatalı karakterler dönürecektir. İşte python burda devreye girip, duruma göre uygun gürültü azalma filtreleri ya da threshold yaparak , çıktıdaki hata oranını azaltacaktır.

 

Sonraki yazımızda görüşmek üzere

 

kaynak kod : https://github.com/farcompen/OCRpy/blob/master/Python_OCR.py

 

 

Hakkında Faruk GÜNGÖRKalfa


Beni Takip Et

Cevap yazın

Captcha Captcha güncellemek için resime tıkla