Merhaba, bu yazıda sizlere C# ile Tesseract OCR Kullanımı hakkında bilgi vereceğim. Bir önceki yazımızda C# Mobil Uygulamaya Bildirim Göndermek(OneSignal) hakkında bilgi verdim.
C# ile Tesseract OCR Kullanımı Nerede İşimize Yarar ?
Tesseract bir OCR kütüphanesidir. OCR ise bir optik karakter tanıma ifadesinin İngilizce baş harflerini ifade etmektedir. Tarayıcıdan tarattığınız bir resmin üzerinde yazıları text çıktı olarak alabilirsiniz. Daha sonra bunları farklı amaçlarda kullanabilirsiniz.
Proje Kodlarının Eklenmesi
Projenize doğrudan import etmek için Nuget üzerinden komutu çalıştırabilirsiniz.
1 | Install-Package Tesseract |
Tesseract varsayılan olarak ingilizce olarak gelmektedir. Farklı dil seçenekleri için buradan indirebilirsiniz. Farklı dil seçenekleri bulunmaktadır. İndirdiğiniz dosyayı projenizin debug bölümündeki yola aktarıp proje içerisinde o yolu belirtmeniz gerekecektir. O bölüme gelince tekrar hatırlatacağım.
Aşağıdaki kodları Using kısmına ekleyelim.
1 | using Tesseract; |
Daha sonra ben projede bir adet textbox bir adet button ve bir adet openfiledialog kullandım. Onları projeye ekleyelim. Sabit bir dosya eklemek yerine openfiledialog ile farklı farklı resimleri deniyebilirsiniz.
Button click eventine aşağıdaki kodları yazalım. Burada “tessdata” yukarıda linkini verdiğim dil paketlerinin klasör ismini belirtmektedir. Ben klasör açtım ve dosyaları orada topladım. “eng”, “tur” veya farklı dilleri yazabilirsiniz. Ona göre size bir text çıkartacaktır.
1 2 3 4 5 6 7 8 9 | if (openFileDialog1.ShowDialog() == DialogResult.OK) { var img = new Bitmap(openFileDialog1.FileName); var ocr = new TesseractEngine("./tessdata", "eng", EngineMode.Default); var page = ocr.Process(img); txtSonuc.Text = page.GetText(); } |
Soru ve görüşleriniz için [email protected] adresine mail atabilirsiniz.