LibCamp#1 : Thai OCR Technology Topic

หลังจากพักทานอาหารว่างกันแล้วงาน LibCamp#1 ก็ดำเนินต่อไป

ผู้ที่ออกมาพูดคนที่ห้าของงาน LibCamp#1
คือ คุณวศิน สินธุภิญโญ จาก สวทช.
ซึ่งมาเล่าเกี่ยวกับเทคโนโลยีไทยโอซีอาร์ (Thai OCR Technology)

thai-ocr

OCR ย่อมาจาก Optical character recognition
การทำงานของ OCR คือ นำไฟล์เอกสารที่อยู่ในรูปแบบของภาพ
นำมาผ่านโปรแกรมเพื่อถอดข้อความที่เป็นตัวอักษรออกมา

ลักษณะของ OCR ในปัจจุบันมีอยู่ 2 รูปแบบหลัก คือ
– แบบออนไลน์ คือ การเขียนตัวอักษรแล้วโปรแกรมก็จะเปลี่ยนลายมือของเราเป็นตัวอักษร
– แบบออฟไลน์ คือ การนำไฟล์ที่ได้จากการสแกนมาผ่านกระบวนการแปลงเป็นตัวอักษรทีหลัง

ocr-technology

ประโยชน์ของการใช้ OCR
– เราสามารถนำผลลัพธ์ของการทำ OCR ไปแก้ไขได้
– เราสามารถนำข้อมูลที่ได้จากการทำ OCR ไปลงในฐานข้อมูลได้
– ลดเนื้อที่ในการจัดเก็บ (ไฟล์ข้อความมีขนาดเล็กกว่าไฟล์ภาพ)
– สามารถนำมาใช้ในการสืบค้นได้อย่างมีประสิทธิภาพ

นอกจากนี้แล้ว คุณวศิน ยังได้กล่าวถึงการพัฒนาโปรแกรม ARNthai ดังนี้

Arnthai 1.0เริ่มต้นในปี 1997 ใช้ได้กับ window 3.1 / 95
ความถูกต้องของการใช้งาน 90% และมีราคา 3,500 บาท

Arnthai 2.0เริ่มต้นในปี 1999 ใช้ได้กับ window 3.1 / 95
ความถูกต้องของการใช้งาน 95% และมีราคา 295 บาท

Arnthai 2.5เริ่มต้นในปี 2004 ใช้ได้กับ window 95 / 98 / Me / XP
ความถูกต้องของการใช้งาน 95% และมีราคา 180 บาท

นอกจากบรรยายแล้ว คุณวศินยังได้สาธิตการใช้โปรแกรม Arnthai ด้วย
นอกจากจะพัฒนาของภาษาไทยแล้ว ตอนนี้ยังมีการพัฒนาเพื่อให้ใช้ได้กับภาษาลาวด้วย
แบบนี้สิ เขาเรียกว่าเจ๋งจิงๆ สุดยอดดดดด!!!!

About libraryhub 883 Articles
นายเมฆินทร์ ลิขิตบุญฤทธิ์ (วาย) ผู้เขียนบล็อกที่เกี่ยวกับห้องสมุดและบรรณารักษ์เป็นงานอดิเรก ปัจจุบันเขียนบล็อกเกี่ยวกับห้องสมุดมาแล้ว 700 กว่าเรื่อง และให้บริการเป็นที่ปรึกษาด้านงานต่างๆ ในห้องสมุด สิ่งที่อยากบอกหลายๆ คน คือ "ผมไม่ใช่ผู้เชียวชาญด้านห้องสมุด แต่ผมก็เป็นคนธรรมดาคนนึงที่เขียนบล็อกห้องสมุดก็เท่านั้นเอง"

3 Comments

  1. จากที่ได้ทดลองใช้ Arnthai 2.5 แล้วก็สามารถใช้ได้ดีในระดับหนึ่ง เป็นที่พอใจครับ

  2. หาซื้อได้ที่ไหนละ วิธีการสั่งซื้อด้วยครับ

Leave a Reply

Your email address will not be published.


*