Whatsapp

gImageReader – แยกข้อความจากรูปภาพและ PDF ใน Linux

Anonim

gImageReader เป็นโปรแกรมอ่าน PDF แบบโอเพ่นซอร์สฟรีที่มีความสามารถในการแยกข้อความจากรูปภาพและ PDF มันถูกสร้างขึ้นเป็น Gtk/Qt ส่วนหน้าอย่างง่ายสำหรับ Tesseract-OCR ซึ่งเป็นเอ็นจิ้น OCR แบบโอเพ่นซอร์สสำหรับการจดจำข้อความและรูปแบบในเอกสารและรูปภาพโดยใช้ปัญญาประดิษฐ์

โดยตัวมันเอง Tesseract เป็นเครื่องมือบรรทัดคำสั่งที่จำกัดการใช้งานโดยผู้ใช้ Linux ที่คุ้นเคยกับเทอร์มินัลของตนมากพอ ขอบคุณ gImageReader ตอนนี้ทุกคนสามารถใช้ประโยชน์จากประสิทธิภาพ OCR ของเครื่องยนต์ได้แล้ว

gImageReader ทำงานโดยการสแกนข้อความจากไฟล์ PDF หรือไฟล์รูปภาพในภาษาต่างๆ ที่รองรับด้วยอักขระ Unicode . มันมีส่วนต่อประสานผู้ใช้ที่ปรับแต่งได้ง่ายและมีการจัดระเบียบอย่างดี ซึ่งคุณสามารถดำเนินการตรวจการสะกดคำและงานแปล

คุณสมบัติใน gImageReader

gImageReader ใช้งานง่ายและรองรับการทำงานกับเอกสาร soft copy รวมถึงสแนปช็อตของสื่อที่อัพโหลดเช่น ภาพหน้าจอ คุณยังมีตัวเลือกให้เลือกพื้นที่ข้อความที่คุณสนใจและเพิ่มเฉพาะข้อความที่คุณต้องการ ในที่สุด gImagereader ทำหน้าที่เป็นทั้งโปรแกรมอ่าน PDF และเครื่องมือแยกข้อความ ของกาก

ติดตั้ง gImageReader บน Linux

หากต้องการใช้ gImageReader ให้เต็มที่ คุณต้องติดตั้งด้วยตนเอง Tesseract ชุดภาษา เพื่อให้คุณสามารถวิเคราะห์รูปภาพและไฟล์ได้อย่างถูกต้องแพ็คเกจนี้เรียกว่า 'Tesseract-ocr-eng' และพร้อมใช้งานจากตัวจัดการซอฟต์แวร์ใน Debianและ Fedora distros.

หากคุณกำลังใช้งาน Ubuntu คุณสามารถเพิ่ม PPAและเรียกใช้คำสั่งติดตั้งโดยใช้คำสั่งด้านล่าง:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt ปรับปรุง
$ sudo apt ติดตั้ง gimagereader

เปิด Debian, Fedora และ OpenSUSE ติดตั้งจากตัวจัดการแพ็คเกจ

$ sudo apt ติดตั้ง gimagereader
$ sudo dnf ติดตั้ง gimagereader
$ sudo zypper ติดตั้ง gimagereader

อย่ารู้สึกว่าถูกทิ้งหากคุณกำลังใช้งาน Arch Linux หรืออนุพันธ์ใดๆ ของมัน AUR ครอบคลุมคุณแล้ว และหากคุณต้องการสร้างแอปใหม่จากแหล่งที่มา คำแนะนำจะอยู่ในลิงก์ Wiki ที่เก็บ GitHub

คุณเป็นคนหนึ่งที่แยกข้อความที่พิมพ์ออกจากรูปภาพหรือไม่? คุณยังสามารถถ่ายภาพสแนปชอตของพื้นที่ที่เลือกด้วยโทรศัพท์ของคุณและอัปโหลดไปยังแล็ปท็อปของคุณ ที่เจ๋งไปกว่านั้นคือการรองรับหลายภาษา ซึ่งแม้ว่าจะไม่สมบูรณ์แบบ แต่ก็เป็นหนึ่งในตัวเลือกที่ดีที่สุดในชุมชนตอนนี้

gImageReader เป็นหนึ่งในโปรแกรมอ่าน PDF ที่ดีที่สุดในโลกโอเพ่นซอร์ส โดยเฉพาะอย่างยิ่งด้วยความสามารถ OCR ดังนั้นลองดูสิ ชอบแบบไหน

ตามปกติ คุณสามารถแบ่งปันประสบการณ์ของคุณกับแอปกับเราหากคุณมี และเสนอแนะอื่นๆ เพิ่มเติม ในช่องแสดงความคิดเห็นด้านล่าง