แอพ 'พาที-คนพูดแอพพิมพ์'

แอพพลิเคชั่น “พาที ระบบรู้จำเสียงพูดภาษาไทย”
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) ได้ร่วมมือกับ ภาควิชาวิศวกรรมคอมพิวเตอร์ จุฬาลงกรณ์มหาวิทยาลัย พัฒนาแอพพลิเคชั่นบนสมาร์ทโฟน ระบบปฏิบัติการ iOS6 ชื่อว่า “พาที” (party) ซึ่งเป็นแอพพลิเคชั่นที่ช่วยในการแปลคำพูดเป็นข้อความภาษาไทย โดยแอพพลิเคชั่นนี้จะใช้เทคโนโลยีระบบรู้จำเสียงพูดภาษาไทย Automatic speech recognition, ASR ซึ่ง NECTEC เป็นผู้พัฒนาขึ้น

flickr:9692200555

รูปแบบการให้บริการ

การให้บริการของแอพพลิเคชั่น ”พาที” จะมีอยู่ 2 รูปแบบคือ
1. บริการส่งเอสเอ็มเอสฟรีด้วยเสียงพูด
บริการส่ง SMS ฟรีด้วยเสียงพูดนั้นเป็นบริการหลักของแอพพลิเคชั่นนี้ โดยผู้ใช้ต้องเข้าสู่ระบบผ่านเฟสบุ๊ค เพื่อเข้าสู่บริการฝากข้อความเสียง กดปุ่มสีเขียวเพื่อบันทึกเสียง กดปุ่มหยุดเพื่อทำการบันทึกเสียง จากนั้นจึงกดหมายเลขโทรศัพท์ที่ต้องการส่ง ข้อความเสียงนั้นจะถูกส่งไปยังเซิร์ฟเวอร์เพื่อให้พนักงานที่ให้บริการอยู่เบื้องหลังถอดข้อความเสียงพูด และส่งข้อความที่ถอดได้นั้นไปยังหมายเลขปลายทาง พร้องทั้งส่งอีเมลยืนยันบริการเสร็จสมบูรณ์กลับไปยังผู้ใช้

2. บริการเสริมเพื่อทดสอบระบบรู้จำเสียงพูดภาษาไทยที่พัฒนาขึ้น
โดยผู้ใช้พูดข้อความลงในโทรศัพท์ จากนั้นแอพพลิเคชั่นจะทำการแปลงเป็นข้อความ โดยการทำงานนั้นประกอบไปด้วย 3 ส่วน ได้แก่ แบบจำลองภาษา พจนานุกรมคำอ่าน และแบบจำลองเสียง ซึ่งเมื่อเปล่งเสียงพูด ระบบทั้ง 3 จะทำการวิเคราะห์หรือเดาคำศัพท์ที่ควรจะเป็น แล้วถอดรหัสออกมาเป็นตัวอักษรซึ่งข้อความที่ได้นั้นสามารถเปลี่ยนแปลง แก้ไข หรือแชร์ต่อได้ด้วย โดยในขณะนี้มีได้รวบรวมคำภาษไทยจำนวน 37,000 คำ สามารถบันทึกเสียงได้นาน 10 วินาที หรือ ประมาณ 20-30 คำ ความถูกต้องประมาณ 50% คำศัพท์ส่วนใหญ่เป็นด้านการท่องเที่ยวและกีฬาต่างๆ

flickr:9692200487

โดยทางผู้พัฒนาตั้งเป้าหมายว่าในช่วง มิ.ย. 2557 แอพพลิเคชั่นนี้จะมีความสามารถเพิ่มขึ้น 5 ด้าน คือ
1. ไม่จำกัดเนื้อหาและพัฒนาจำนวนคำให้มากขึ้น 1 แสนคำ
2. ทำงานได้ทุกช่องทางโทรศัพท์เคลื่อนที่
3. ความถูกต้องเพิ่มขึ้น 80% จากเดิม 50%
4. เปิดเป็นเว็บไซต์เซอร์วิสภาษาไทยโดยความร่วมมือของเนคเทค และจุฬาลงกรณ์มหาวิทยาลัย
5. ใช้เวลาประมวลผลเร็ว 1-2 วินาที จากเดิม 3-5 วินาที

แอพพลิเคชั่นนี้สามารถนำไปประยุกต์ใช้ในอุตสาหกรรมโทรคมนาคม เพิ่มปริมาณการรับสายของ call-center ลดต้นทุนค่าใช้จ่าย มีระบบติดตามการประเมินผลตลอดเวลา สามารถบรรยายใต้ภาพที่เหมาะสำหรับอุตสาหกรรม ทีวีดิจิทัลที่คณะกรรมการกิจการกระจายเสียง กิจการโทรทัศน์และกิจการโทรคมนาคม (กสทช.) หวังให้เข้าถึงทุกคนทั่วถึงและเท่าเทียมกัน การถอดความเสียงบันทึกการประชุม อาทิ ศาล และประชุมรัฐสภา รวมถึงการอำนวยความสะดวกสำหรับผู้พิการ ผู้ด้อยโอกาส และผู้สูงอายุที่มีข้อจำกันในการป้อนข้อมูลด้วยการพิมพ์ข้อความ

วิเคราะห์
ในส่วนของตัวแอพพลิเคชั่นเองนั้น เนื่องจากตอนนี้เป็นช่วงของการเปิดให้ทดลองใช้ บริการหลักที่เป็นการส่ง SMS นั้น เป็นสิ่งที่ดูเหมือนจะยุ่งยากกว่าการส่ง SMS ธรรมดา นอกจากนี้การส่งข้อความ SMS ในปัจจุบันก็มีการใช้บริการน้อยลง ผู้คนนิยมใช้งานในส่วนของ social network , line กันมากกว่า อาจจะทำให้คนจะเข้ามาใช้บริการนี้น้อย ซึ่งจะส่งผลกระทบต่อคลังข้อมูลเสียงที่ทางเนคเทคกำลังต้องการ เพื่อที่จะเพิ่มฐานข้อมูลที่จะทำให้การประมวลผลถูกต้องมากยิ่งขึ้น

ในส่วนของบริการเสริม เนื่องจากเป็นแอพพลิเคชั่นที่ให้โหลดฟรี แต่ในขณะนี้ก็มีข้อจำกัดอยู่ที่ต้องเป็นระบบ iOS6 เท่านั้น ทำให้ไม่สามารถเข้าถึงผู้ใช้ได้อย่างทั่วถึง อีกทั้งในการประมวลผลจะต้องเชื่อมต่อกับอินเตอร์เน็ต ซึ่งความเร็วของการประมวลผลนั้นจะขึ้นอยู่กับความเร็วของอินเตอร์เน็ตด้วย ซึ่งก็เป็นอีกหนึ่งปัญหาที่ความเร็วของอินเตอร์เน็ตในบ้านเราตอนนี้ยังไม่ดีมากนัก รวมทั้งที่กล่าวในขั้นต้นว่ายังอยู่ในช่วงทดลอง และต้องการคลังข้อมูลเสียงจากผู้ทดลองใช้ จึงทำให้ขณะนี้ยังมีความถูกต้องเพียงประมาณ 50% อีกทั้งยังขึ้นอยู่การออกเสียงอักขระของผู้ใช้งาน และเสียงรอบข้างอีกด้วย

ในส่วนของแอพพลิเคชั่นประเภทระบบรู้จำเสียงของภาษาไทยก็เคยมีให้เห็นแล้วเช่นกัน คือประมาณเดิอนตุลาคม 2555 นั่นก็คือแอพพลิเคชั่น Dragon Dictation จากบริษัท Nuance Communication ประเทศสหรัฐอเมริกา ซึ่งมีฟังก์ชั่นใกล้เคียงกับแอพพลิเคชั่นพาที คือ แปลคำพูดให้เป็นข้อความ สามารถแก้ไขข้อความที่ไม่ถูกต้อง และสามารถแชร์ข้อความผ่านทาง Facebook, Twister, sms หรือ email โดยมีความแม่นยำถึง 70-80% จะเห็นว่าพาทีนั้นยังต้องมีการพัฒนาอีกมากเพื่อที่จะประมวลผลในการแปลข้อความให้รวดเร็วและถูกต้อง ซึ่งส่วนหนึ่งก็มาจากฐานข้อมูลเสียงในระบบที่เราสามารถช่วยกันป้อนข้อมูล เพื่อเป็นส่วนหนึ่งในการพัฒนาแอพพลิเคชั่นของคนไทยให้ประสบความสำเร็จได้

อ้างอิง :
http://thainews.prd.go.th/centerweb/News/NewsDetail?NT01_NewsID=WNICT5608230020003
http://www.dailynews.co.th/technology/228663
http://isensoft.wordpress.com/2012/10/24/review-dragon-dictation/

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License