CHULALONGKORN UNIVERSITY TECHNOLOGY CENTER
  • About
  • Our Portfolio
  • MedVentures
  • AI Academy
  • AI Services/Servers
  • FEDERATED LEARNING
  • PAST WORKSHOPS/SEMINARS
  • PRESS
  • Articles
  • Contact

ReadMe

4/29/2020

 

Read Me: Deep Thai Text Reader

Picture
               
               ปัจจุบันโปรแกรมอ่านข้อความจากภาพมีความสำคัญมาก เนื่องจากสามารถประยุกต์ได้แพร่หลายมากขึ้น เช่น การนำเข้าข้อมูลจากการถ่ายภาพแทนการคีย์ข้อมูล การแปลภาษา การอ่านข้อความเพื่อช่วยผู้พิการในการมองเห็น เป็นต้น ตลอดหลายสิบปีที่ผ่านมา มีงานวิจัยพัฒนามากมายในการสร้างโปรแกรมอ่านข้อความจากเอกสารที่ได้จากเครื่องสแกนภาพ (Scanned Document) ซึ่งทำงานได้ผลดีมากระดับหนึ่ง แต่โปรแกรมเหล่านั้นยังไม่สามารถทำงานได้ดีกับภาพถ่ายลักษณะทั่วไป (Scene Image) เนื่องจากภาพถ่ายทั่วไปมีความหลากหลายและซับซ้อนกว่าภาพถ่ายจากเครื่องสแกนเอกสารในหลาย ๆ ด้าน อาทิเช่น สภาพแสง ตําแหน่งของข้อความในภาพ รูปแบบของตัวอักษร การเบลอของตัวอักษร ฉากหลังที่มีความซับซ้อน มุมภาพ และอาจมีการบดบังตัวอักษรเกิดขึ้น เป็นต้น ดังนั้นการพัฒนาโปรแกรมที่สามารถอ่านข้อความจากภาพถ่ายทั่วไปได้นั้นจึงเป็นสิ่งสำคัญและเป็นความความท้าทายอย่างมากทำให้ในปัจจุบันได้รับความสนใจจากนักวิจัยทั่วโลก
       
              นอกจากความท้าทายดังกล่าวยังมีความท้าทายอีกประการหนึ่งของปัญหานี้ คือภาษาไทยลักษณะของโครงสร้างภาษาที่แตกต่างกับภาษาอื่น ๆ อยู่หลายประการ อาทิเช่น อักขระ สระ และวรรณยุกต์ ที่ในหนึ่งบรรทัดประกอบด้วยตำแหน่ง 4 ระดับ ซึ่งแตกต่างจากภาษาส่วนใหญ่ที่เขียนระดับเดียวในแต่ละบรรทัด รวมถึงรูปร่างของตัวอักษรภาษาไทยที่มีความคล้ายคลึงกัน เช่น ม และ ฆ การเขียนที่หลากหลาย เช่น มีหัว ไม่มีหัว เขียนแบบตัวพิมพ์ แบบหวัดมีหาง และมีความซับซ้อนของไวยกรณ์ภาษา เป็นต้น          
                                                                                               
                  ทีมงานได้พัฒนาโปรแกรมอ่านข้อความภาษาไทยจากภาพถ่ายโดย ใช้เทคโนโลยีการประมวลผลภาพ (Image Processing) ร่วมกับเทคโนโลยีการเรียนรู้เชิงลึก (Deep Learning) แบบ Adaptive Learning Representation ที่เหมาะกับภาษาไทย จึงทำให้ได้ความแม่นยำมากกว่าโปรแกรมอื่นๆ  ตามเป้าหมายที่จะพัฒนาโปรแกรมอ่านข้อความภาษาไทยให้มีความแม่นยำมากขึ้น และพัฒนาในโปรแกรมในรูปแบบ API เพื่อให้โปรแกรมอื่น ๆ สามารถเรียกใช้ได้อย่างสะดวกและมีประสิทธิภาพ ซึ่งจะส่งผลต่อการพัฒนาอุตสาหกรรม Digital เป็นอย่างมาก เนื่องจากสามารถนำไปประยุกต์ใช้ในการพัฒนาแอพพลิเคชั่นต่าง ๆ ได้มากมาย เช่น โปรแกรมนำเข้าข้อมูลจากการถ่ายภาพแทนการคีย์ข้อมูล โปรแกรมแปลภาษา โปรแกรมอ่านข้อความเพื่อช่วยผู้พิการในการมองเห็น โปรแกรมเสริมของระบบนำทาง โปรแกรมอ่านข้อความสลากยาสำหรับผู้สูงวัย  เป็นต้น         

Comments are closed.
Picture

CHULALONGKORN
​UNIVERSITY TECHNOLOGY CENTER

Get in touch
Subscribe to Newsletter
Picture
​Copyright © 2020 Chulalongkorn University Technology Center
  • About
  • Our Portfolio
  • MedVentures
  • AI Academy
  • AI Services/Servers
  • FEDERATED LEARNING
  • PAST WORKSHOPS/SEMINARS
  • PRESS
  • Articles
  • Contact