Home Technology “THAI SER” แพลตฟอร์ม AI เจ้าแรก ตรวจจับความรู้สึกผ่าน “เสียงภาษาไทย”

“THAI SER” แพลตฟอร์ม AI เจ้าแรก ตรวจจับความรู้สึกผ่าน “เสียงภาษาไทย”

by Lifeelevated Admin1

เอไอเอส และ สถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย (AIResearch) ผนึกกำลังเพื่อพัฒนา THAI SER แพลตฟอร์มตรวจจับความรู้สึกจากเสียงภาษาไทย (Speech Emotion Recognition) ที่ใช้เวลาเก็บข้อมูลโดยละเอียดถึง 2 ปี จนแล้วเสร็จเป็นโซลูชั่นใหม่แกะกล่อง และเป็น Dataset ภาษาไทยชุดแรกของประเทศ

ก่อนจะเป็น SER Dataset ความสำเร็จของคนไทยที่พูดภาษาไทย

คุณอราคิน รักษ์จิตตาโภค หัวหน้าฝ่ายงานขับเคลื่อนนวัตกรรม บริษัท แอดวานซ์ อินโฟร์ เซอร์วิส จำกัด (มหาชน) หรือ Head of NEXT, AIS กล่าวถึงการใช้ภาษาไทยที่จำกัดอยู่ในกลุ่มคนไทยว่า

“ประเทศไทยมีประชากรมากกว่า 60 ล้านคน เราไม่สามารถรอให้แพลตฟอร์มจากต่างประเทศมาทำเสียงภาษาไทยได้ เพราะไม่สามารถขยายแบบ economy of scale เราจึงสร้าง AI ตรวจจับความรู้สึกจากเสียงภาษาไทยขึ้นมา เพื่อให้คนไทยนำไปต่อยอดได้ สิ่งที่เราทำไม่ได้เอาคำพูดมาแปลงเป็นภาษาไทย แต่เราตรวจจับความรู้สึกจากเส้นเสียงเวลาพูดภาษาไทย และพัฒนาจนเป็น THAI SER ชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทย”

ปกติแล้วนักพัฒนามักจะพัฒนาโปรแกรมโดยต่อยอดจากข้อมูลที่มีการพัฒนาเอาไว้แล้ว เช่น ภาษาอังกฤษ ที่ผ่าน NLP (Natural Language Processing) หรือ การประมวลผลภาษาธรรมชาติหรือภาษามนุษย์ เพื่อให้คอมพิวเตอร์เข้าใจภาษา ไม่ว่าจะเป็นการพิมพ์หรือการพูด แต่สำหรับภาษาไทยนั้น ยังไม่มีใครหรืองค์กรใดพัฒนาโซลูชั่นเอาไว้อย่างเป็นระบบ เอไอเอส จึงร่วมกับ สถาบันวิจัยเทคโนโลยีปัญญาประดิษฐ์ประเทศไทย พัฒนาระบบประมวลผลข้อมูลด้วย AI ขึ้น

สถาบันวิจัยเทคโนโลยีปัญญาประดิษฐ์ประเทศไทย เกิดจากความร่วมมือระหว่าง สถาบันวิทยสิริเมธี (VISTEC) และ สำนักงานส่งเสริมเศรษฐกิจดิจิทัล (depa) โดยได้รับการสนับสนุนจาก บริษัท แอดวานซ์ อินโฟร์ เซอร์วิส จำกัด (AIS)

“ภาษาไทยมีลักษณะที่แปลก อธิบายง่ายๆ ก็เรื่อง การตัดคำ เราพิมพ์ติดกันโดยไม่มีการเว้นวรรคแบบภาษาอังกฤษ ไม่มีจุดจบประโยคเหมือนภาษาอังกฤษ ดังนั้น เวลาที่เราจะประมวลผลภาษาไทยจึงมีความท้าทายมาก และบางทีสระหรือวรรณยุกต์ก็หายไป เนื่องจากภาษาอื่นไม่มีสระด้านบนด้านล่างแบบเรา นี่จึงเป็น Language Barrier สำคัญ”

อราคิน อธิบายเพิ่มเกี่ยวกับการพัฒนา AI ต่อว่า ต้องเริ่มจาก 1) การเก็บ Data 2) การป้อน Data ที่มากพอ 3) Data นั้นต้องมีคุณภาพ และยังบอกด้วยว่า ถือเป็นจังหวะดีที่ได้นักวิจัยจาก MIT มาร่วมจัดระบบระเบียบหรือ Cleansing Data ให้ตั้งแต่เริ่มต้น ทำให้ลดกระบวนการในส่วนนี้ลงไป

“เราเก็บ Data จากการอัดเสียงประโยคสนทนาทั่วไปในสตูดิโอ ‘อยากกินอะไร’ ‘ขี้เกียจไปทำงาน’ ‘มาเร็วจังเลยนะ’ จากนักแสดง 200 คน มาพูดเพื่ออัดและประเมินน้ำเสียง เช่น น้ำเสียงตัดพ้อ เขินอาย ประชด จนเป็น Dataset ที่รวมแล้วมี 28,000 ประโยค”

เมื่อได้ ชุดข้อมูล (Dataset) ทีมนักวิจัยไทยก็ร่วมพัฒนา ชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทย (THAI SER : Speech Emotion Recognition) โดยพัฒนาเทคโนโลยี AI เข้าสู่กระบวนการเรียนรู้ (Deep Learning) ซึ่งในโลกของ Deep Learning มีเพียงคอมพิวเตอร์หรือ Machine ที่เห็นแพทเทิร์น และสามารถเรียนรู้เหมือนที่มนุษย์เรียนรู้ซ้ำๆ แล้วเข้าใจมากขึ้น จากนั้นประยุกต์ใช้ในการประมวลผลสัญญาณเสียง เพื่อให้ระบบเข้าใจ คุณลักษณะของเสียง ที่บ่งบอกความแตกต่างของอารมณ์จากการพูดภาษาไทย

THAI SER ตรวจจับอารมณ์แบบใดบ้าง

ชุดข้อมูล THAI SER สามารถจำแนกเสียงได้ 5 อารมณ์ ได้แก่ โกรธ, เศร้า, สุข, หงุดหงิด และปกติ โดยมีความแม่นยำอยู่ที่ 70% และมีความพร้อมที่จะใช้งานสูงถึง 80% ส่วนอีก 20% องค์กรหรือนักพัฒนาสามารถใช้เป็นแบบจำลองพื้นฐานในการพัฒนาระบบวิเคราะห์ให้มีความแม่นยำมากขึ้น และปรับให้เข้ากับสภาพแวดล้อมการทำงานจริงขององค์กรที่มีบริบทแตกต่างกัน

เสียง & เทคโนโลยี AI เสริมแกร่งให้ Telco และธุรกิจอื่นอย่างไร

ในฐานะที่เอไอเอสเป็น Digital Service Provider และเห็นความสำคัญของการพัฒนา โครงสร้างพื้นฐาน AI ภาษาไทย โดยเฉพาะการตรวจจับอารมณ์จากเสียงภาษาไทย ซึ่งต้องการความเชี่ยวชาญเฉพาะด้านเสียงภาษาไทย และ Big Data มาสร้างแพลตฟอร์มให้ใช้งานได้จริง ดังนั้น ความร่วมมือระหว่างเอไอเอสกับ AIResearch ที่เกิดขึ้นนี้ จึงถือเป็นจุดเริ่มต้นของการสร้างระบบนิเวศให้ Deep Tech ในประเทศไทยได้เติบโตอย่างแข็งแกร่งและมีความสามารถทัดเทียมกับนานาชาติ

เอไอเอส ได้เรียนรู้เทคโนโลยีตรวจจับอารมณ์ ร่วมกับ AIResearch และต่อยอดเพื่อใช้ในบริบทของบริษัท รวมถึงพัฒนาเป็นเครื่องมือให้ผู้ประกอบธุรกิจชาวไทยได้ใช้กันฟรีๆ ไม่มีค่าใช้จ่ายใดๆ ในประเด็นทางธุรกิจ ซันเจย์ แอนดรูว์ โทมัส หัวหน้าคณะผู้บริหารด้านเทคโนโลยีสารสนเทศ เอไอเอส อธิบายว่า เทคโนโลยี AI ในปัจจุบันนำมาใช้งานด้านภาษาอย่างกว้างขวาง โดยเฉพาะอย่างยิ่งภาษาอังกฤษ ซึ่งมีประโยชน์มากเมื่อนำมาใช้เพื่อ การสร้างความเข้าใจลูกค้า ผ่านทางอารมณ์และความรู้สึก โดยองค์กรธุรกิจสามารถประเมินสภาวะทางอารมณ์ของลูกค้า เพื่อนำไปใช้เป็นข้อมูลในการเพิ่มประสิทธิภาพด้านงานบริการได้ดียิ่งขึ้น ด้วยการพิจารณาจาก Customer insight ด้านอารมณ์ของลูกค้าที่มาจากการให้บริการด้านต่างๆ

ประโยชน์ของการนำ THAI SER ไปใช้งานจริง

  • วิเคราะห์อารมณ์ของลูกค้า จาก “เสียงพูด”
  • จัดลำดับการให้บริการลูกค้า จาก ‘อารมณ์’ ของลูกค้า
  • มอบหมายสายลูกค้าให้กับ CSR ตามความสามารถในการรับมืออารมณ์ต่าง ๆ
  • ฝึกสอนและเตรียมความพร้อมให้กับ CSR ในการปฏิบัติงานจริง
  • ช่วยเพิ่มความสามารถในการเข้าใจสถานการณ์และเพิ่มโอกาสในการปิดการขาย

จากความสามารถในการตรวจจับอารมณ์จากเสียงภาษาไทย THAI SER จึงเป็นเครื่องมือที่เข้ามาช่วยสร้างความเข้าใจให้แก่ผู้ใช้งานชาวไทยและผู้ที่เกี่ยวข้องได้ ทั้งยังช่วยให้องค์กรน้อยใหญ่รับมือทุกความท้าทายแห่งยุคได้ดียิ่งขึ้น

.

.

ติดตาม Life Elevated ได้ที่

Website: www.lifeelevated.club/

Facebook: Life Elevated ชีวิตยกระดับ

Twitter: @_lifeelevated_

Instagram: @lifeelevatedclub

Line OA: @Lifeelevated

Blockdit: Life Elevated

.

.

#LifeElevated #THAISER #แพลตฟอร์มAI

.

.

อ้างอิง

https://positioningmag.com/1321962

https://www.dailynews.co.th/it/829008

https://mgronline.com/cyberbiz/detail/9640000021315

https://www.salika.co/2021/03/12/ai-thai-ser-first-tool/

https://www.iphone-droid.net/ais-x-airesearch-thai-ser/

Related Articles

Leave a Comment