ม.มหิดลพัฒนา'AI ตรวจจับคำพูดหยาบ' เพื่อสังคมออนไลน์ที่สร้างสรรค์สำหรับเด็กไทย

06 Jul 2023

ข้อมูลจากสถาบันสุขภาพเด็กแห่งชาติมหาราชินี กรมการแพทย์ กระทรวงสาธารณสุข ได้กล่าวถึงสาเหตุที่ทำให้เด็กพูดจาหยาบคาย ส่วนหนึ่งเกิดจาก "พฤติกรรมเลียนแบบจากสื่อต่างๆ" ซึ่งสื่อสารด้วย "คำพูดหยาบคาย" กันจนดูเหมือนเป็นเรื่องปกติ

ม.มหิดลพัฒนา'AI ตรวจจับคำพูดหยาบ' เพื่อสังคมออนไลน์ที่สร้างสรรค์สำหรับเด็กไทย

แต่ที่น่าเป็นห่วงที่สุดคือ การปล่อยปละละเลยโดยเฉพาะอย่างยิ่งในเด็กเล็กตั้งแต่ชั้นอนุบาล ที่มักจดจำและเลียนแบบจากบุคคลหรือสิ่งรอบตัวจนเติบโตกลายเป็นผู้ใหญ่ที่มีปัญหาทางบุคลิกภาพ จากการชอบพูดคำหยาบคาย และก้าวร้าวรุนแรงจนเป็นนิสัย

รองศาสตราจารย์ ดร.ศุภวงศ์ ทั่วรอบ และ อาจารย์ ดร.ธนพลนรเสฏฐ์ กลุ่มวิทยาการคอมพิวเตอร์ รวมถึงนักศึกษาคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล ในฐานะ "ปัญญาของแผ่นดิน" ได้ร่วมกันคิดค้นอัลกอริทึม "FALCoN" (Foul and Abusive Language detection using Co-training in social Networks) ด้วยทุนสนับสนุนจาก สำนักงานคณะกรรมการส่งเสริมวิทยาศาสตร์ วิจัย และนวัตกรรม (สกสว.)

เพื่อหาทางออกจาก "มุมมืดของสื่อสังคมออนไลน์" ดังกล่าวด้วยการใช้เทคโนโลยีปัญญาประดิษฐ์ (AI) ในการตรวจจับคำพูดหยาบภาษาไทยในสื่อสังคมออนไลน์ และเป็นผลงานที่ได้รับการตีพิมพ์แล้วในวารสารวิชาการระดับโลก"Information Processing & Management"

โดย รองศาสตราจารย์ ดร.ศุภวงศ์ ทั่วรอบ รับผิดชอบในการออกแบบ และควบคุมทางเทคนิค ด้วยความเชี่ยวชาญที่มากด้วยประสบการณ์จากการใช้ AI วิเคราะห์สื่อสังคมออนไลน์ที่ผ่านมา

โดยมี อาจารย์ ดร.ธนพล นรเสฏฐ์ ผู้เชี่ยวชาญด้านการประมวลผลภาษาธรรมชาติ (NLP) ร่วมให้การดูแล และให้คำปรึกษานักศึกษาของคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล ที่เป็นส่วนสำคัญในการร่วมสร้างชุดข้อมูลเพื่อทดสอบระบบ "FALCoN" คำพูดที่ไม่เหมาะสมในสื่อสังคมออนไลน์ ประกอบด้วยคำพูดหยาบ คำเปรียบเปรยเสียดสี คำก้าวร้าวรุกราน และคำที่ส่อไปในทางลามกอนาจาร

จุดท้าทายอยู่ที่จะทำอย่างไรให้ AI สามารถทำงานตรวจจับคำพูดที่ไม่เหมาะสมในสื่อสังคมออนไลน์ได้อย่างครอบคลุมโดยภาษาไทยบางคำ เมื่อปรากฏเป็นคำเดี่ยว จะไม่เป็นคำหยาบคาย ต้องอาศัยการตีความเมื่อปรากฏในบริบทที่เกี่ยวข้องด้วย

ดังนั้น "FALCoN" จึงใช้เทคนิค Co-Training ในการฝึกสอนปัญญาประดิษฐ์ให้เรียนรู้ลักษณะของภาษาหยาบคาย จากทั้งคำพูดเองและข้อสังเกตจากบริบท เช่น Reaction และข้อความที่อยู่รอบๆ

เนื่องจากสื่อสังคมออนไลน์เป็น "ภาษาดิ้นได้" หรือภาษาที่มีการเปลี่ยนแปลงตลอดเวลา จึงจำเป็นต้องอาศัย "คนรุ่นใหม่" เพื่อทำความเข้าใจการใช้ภาษานี้ นักศึกษาของคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล จึงมีบทบาทสำคัญในการร่วมพัฒนา "FALCoN"

จากการ "ติดฉลาก" ข้อมูล และเขียนโปรแกรมเพื่อทำการทดลองซึ่งเป็นงานที่ต้องอาศัยการใช้วิจารณญาณ และความเชี่ยวชาญเฉพาะทาง ภายใต้การดูแลโดยอาจารย์ที่ปรึกษาและต้องใช้เวลา กว่าจะเสร็จสิ้น และสามารถนำไปใช้ได้จริงจะต้องมี "คลังข้อความ" ที่มากพอ และทดสอบการใช้กับกลุ่มตัวอย่างจนกว่าจะได้ผลจนเป็นที่แน่ใจ

"FALCoN" สามารถนำไปพัฒนาต่อยอดเป็นโปรแกรมอัตโนมัติสมบูรณ์แบบเพื่อใช้คัดกรองภาษาที่ไม่เหมาะสมในสื่อสังคมออนไลน์ ซึ่งจะช่วยทำให้ประหยัดเวลา และงบประมาณ เทียบกับการเฝ้าระวังและคัดกรองด้วยมนุษย์

อย่างไรก็ดี "FALCoN" ยังคงต้องการทุนสนับสนุนเพื่อพัฒนาศักยภาพและต่อยอดเป็นโปรแกรมที่สมบูรณ์แบบก่อนการเปิดใช้ได้จริงในอนาคต

งานวิจัย "FALCoN" เป็นอีกหนึ่งตัวอย่างของการมีส่วนร่วมของนักศึกษาในการเรียนรู้และร่วมแก้ไขโจทย์ปัญหาทางสังคมไทย ด้วยองค์ความรู้ทางวิทยาการคอมพิวเตอร์และปัญญาประดิษฐ์ จากคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล เพื่อ "สังคมออนไลน์ที่สร้างสรรค์" สำหรับน้องๆ รุ่นเยาว์ที่ยังอ่อนด้อยประสบการณ์ทางสังคม ให้พร้อมเติบโตเป็นผู้ใหญ่ที่สมบูรณ์และเป็นกำลังสำคัญร่วมพัฒนาสังคมและเศรษฐกิจของประเทศชาติให้ยั่งยืนสืบไป

HTML::image(