GImageReader ile Ücretsiz, Açık Kaynaklı Görsel Simge Tanıma

GImagereader, Tesseract OCR motoru için bir ön uç uygulamasıdır. Tesseract’ta yeni olanlar için, resimlerdeki basılı metinleri aramak ve tanımak için yapay zekadan yararlanan bir Optik Karakter Tanıma Motorudur (OCR). Açık kaynaklı bir kitaplıktır ve piyasadaki en popüler OCR motorlarından biridir.

Optik Karakter Tanıma (OCR), metnin taranmış, statik görüntülerini makine tarafından okunabilir verilere dönüştürerek metin aramayı, düzenlemeyi ve analiz etmeyi mümkün kılan güçlü bir araçtır. OCR kullanıyorsanız, büyük ihtimalle ABBYY FineReader veya Adobe Acrobat Pro ile çalışıyorsunuzdur. Bununla birlikte, hem ABBYY hem de Acrobat, yüksek bir fiyat etiketine sahip tescilli yazılımlardır.

gImageReader: Tesseract OCR için Platformlar Arası Bir Ön Uç

gImageReader, Linux’ta resimlerden ve PDF’lerden metin ayıklamanıza izin veren bir uygulamadır. Temelde bir GUI veya Hewlett-Packard tarafından geliştirilen ve mevcut en iyi OCR motorlarından biri olarak kabul edilen açık kaynaklı bir motor olan Tesseract OCR motorunun ön ucudur .

gImageReader’ın Özellikleri

gImageReader aşağıdaki özellikleri içerir:

  • Farklı kaynaklardan (disk, tarama cihazları, pano ve ekran görüntüsü) PDF belgelerini ve görüntüleri içe aktarın
  • Görüntüleri veya belgeleri toplu olarak işleyin, yani birden fazla görüntüden veya belgeden tek seferde metin çıkarın
  • Metin parçacıklarını düz metin veya hOCR belgeleri olarak tanıma
  • Yerleşik yazım denetleyici
  • Otomatik metin alanı algılama
  • Temel görüntü/belge düzenleme
  • Çıktıyı bir metin dosyası olarak kaydet
  • Ayıklanan metni bir .txt dosyası olarak dışa aktarın
  • Çapraz platform (Linux&Windows&MacOS)-(X86_64-Arm64-RiscV-PPC)

gImageReader’ı Linux’a Kurma

Anadolu Panteri ve Debian tabanlı (Pardus/Ubuntu/Mint)dağıtmlar için

sudo apt install gimagereader tesseract-ocr-all hunspell-tr

Archman ve Arch tabanlı dağıtımlar için

sudo pacman -S gimagereader

Linux’ta gImageReader Nasıl Kullanılır?

gImageReader’ın kullanımı oldukça kolaydır ve her türlü görüntü dosyasıyla ve PDF belgeleriyle çalışır. Linux’ta resimlerden veya PDF’lerden metin çıkarmak için aşağıdaki talimatları izleyin.

Uygulamalar menüsünü açın, gImageReader’ı arayın ve uygulamayı başlatın. Tam ekran görünümünde açmak için gImageReader penceresinde Büyüt düğmesine basın .

Şimdi, araç çubuğunun altındaki sol bölmedeki Görüntü ekle düğmesini tıklayın ve metin ayıklamak istediğiniz görüntüleri veya PDF’leri seçmek için dosya tarayıcıyı kullanın.

Görüntüleri veya PDF’leri gImageReader’a aktarmak için Tamam’a tıklayın . Veya ekranda görüntülenenlerden metin çıkarmak istiyorsanız, Görüntü ekle düğmesinin yanındaki açılır menüyü tıklayın ve Ekran Görüntüsü Al öğesini seçin . gImageReader, ekran içeriğinin ekran görüntüsünü alacaktır.

Görüntüyü gImageReader’a ekledikten sonra, çıktı bölmesini açmak için Çıktı bölmesini değiştir düğmesine (biri not defteri simgesiyle) tıklayın. Resimlerden veya PDF’lerden çıkardığınız metin burada görünür.

Nasıl ilerlemek istediğinize bağlı olarak artık görüntüdeki veya PDF’deki metni otomatik veya manuel olarak belirleme seçeneğine sahipsiniz. Bunu otomatik olarak yapmak için Düzeni otomatik algıla düğmesine tıklayın , seçilen görüntüdeki veya PDF belgesindeki tüm metin bloklarını vurgulayacaktır.

Bundan sonra, metin çıkarma işlemine başlamak için Seçimi tanı > Geçerli Sayfa üzerine dokunun.

Alternatif olarak, metni el ile seçmek için, ayıklamak istediğiniz metnin üzerine gelin ve artı işaretini kullanarak metni çıkarmak istediğiniz alanın çevresine bir kutu çizin. Ardından, devam etmek için Seçimi tanı düğmesine basın.

 

Bu bir PDF belgesiyse ve farklı sayfalardan metin çıkarmak istiyorsanız sayfaları çevirmek için Artı ( + ) düğmesine dokunun.

Geri dönmek için Eksi ( ) düğmesine basın. Ardından, ayıklamak istediğiniz metni seçin ve ayıklamak için Seçimi tanı düğmesine basın.

Nadiren de olsa, gImageReader’ın ayıklanan metni İngilizce dışında bir dilde döndürdüğü zamanlar olabilir. Bu olduğunda, Seçimi tanı düğmesinin yanındaki açılır düğmeye dokunmanız ve İngilizce seçeneklerden birini seçmeniz yeterlidir.

Son olarak, ayıklanan metni kaydetmek için Çıktıyı kaydet düğmesine tıklayın . Bu, Kaydet penceresini getirecektir. Burada dosyaya bir isim verin ve Tamam’a basın .

Görüntü Ekleme, Tanıma Gerçekleştirme ve Dil Ayarlama

Halihazırda taranmış resimleriniz varsa, sol paneldeki bir klasöre benzeyen Resim Ekle düğmesine tıklayarak bunları tanınmaları için ekleyebilirsiniz. Çok sayfalı bir PDF oluşturmak istiyorsanız birden çok görüntü seçebilirsiniz. Daha sonra istediğiniz zaman o klasör düğmesine tekrar tıklayarak daha fazla resim ekleyebilirsiniz.

Bu sol panelde, kullandığınız bilgisayarda bağlı bir tarayıcı varsa görüntüleri doğrudan bir tarayıcıdan almanızı sağlayan Al sekmesi düğmesini de tıklayabilirsiniz.

İstediğiniz görüntüleri elde ettikten sonra, sayfadaki metni tanımak için Tanı düğmesine tıklayın. Birden fazla resim eklediyseniz, her sayfa için bu düğmeyi tıklamanız gerekeceğini lütfen unutmayın.

 

Kaynak: https://github.com/manisandro/gImageReader

About The Author