Google Translate แอปแปลภาษาที่มีติดเครื่อง ซึ่งตอนนี้ Google ได้ประกาศการอัปเดต รองรับภาษาเพิ่มขึ้นอีก 110 ภาษา มีทั้ง ภาษาจีนกวางตุ้งไปจนถึงภาษาพูดของชนเผ่าเล็ก ๆ โดยใช้ AI โมเดลภาษาขนาดใหญ่ PaLM 2 ในการช่วยแปล อนาคตมุ่งเป้าพัฒนาระบบแปลให้ครบคลุมครบ 1,000 ภาษาทั่วโลก

Google Translate รองรับเพิ่ม 110 ภาษา

Google ประกาศ Google Translate จะรองรับภาษาที่หลากหลายขึ้น เตรียมอัปเดตใหม่ 110 ภาษา โดยใช้โมเดลภาษาขนาดใหญ่ PaLM 2 ในการแปล โดยภาษาเด่น ๆ ที่เพิ่มเข้ามาเลยก็จะมี “ภาษาจีนกวางตุ้ง” ซึ่งเป็นภาษาที่ใช้มากกว่า 314 ล้านคน นับเป็น 8% ของประชากรทั่วโลกเลยทีเดียว

ตัวอย่างการแปลภาษาจีนกวางตุ้ง

นอกจากภาษาที่คนใช้กันเยอะ ๆ แล้ว ทาง Google ก็ได้พยายามที่จะฟื้นฟูภาษาที่ใช้กันในชุมชนเล็ก ๆ หรือภาษาอีกสองสามภาษาที่แทบจะไม่มีเจ้าของภาษาด้วย และนี่ก็คือตัวอย่างรายชื่อภาษาใหม่ที่แอปรองรับเพิ่ม

  • ภาษาจีนกวางตุ้ง ภาษาที่มีคนขอใช้งานมากที่สุดบน Google Translate เนื่องจากภาษานี้รูปแบบการเขียนคล้ายกับภาษาจีนแมนดาริน ทำให้ค้นหาข้อมูลหรือเทรนโมเดลค่อนข้างยาก
  • Afar คือ  tonal language ภาษาที่มีวรรณยุกต์ พูดให้เข้าใจง่าย ๆ ว่าเป็นภาษาที่มีเสียงสูงต่ำ ถูกใช้ใน จิบูติ, เอริเทรีย และเอธิโอเปีย ซึ่งในบรรดาภาษาที่เปิดตัวมาทั้งหมดนี้ Afar เป็นภาษาที่ได้รับการสนับสนุนจากอาสาสมัครมากที่สุด
  • Manx ภาษามานซ์ เป็นภาษาเซลติกของเกาะแมน เรียกได้ว่าเป็นภาษาที่ใกล้สาบสูญระดับวิกฤต แต่โชคดีที่มีการฟื้นฟูเกิดขึ้น ทำให้ตอนนี้มีผู้ใช้งานถึง 1 พันคนแล้ว
  • NKo เป็นภาษากลางของแอฟริกันตะวันตก ซึ่งรวมเอาภาษาท้องถิ่นต่าง ๆ มารวมกันให้กลายเป็นภาษามาตรฐานเดียวกัน
  • Punjabi (ปัญจาบ) ภาษาที่มีคนใช้มากที่สุดในปากีสถาน
  • Tamazight (ภาษาเบอร์เบอร์) ที่ใช้กันทั่วแอฟริกาเหนือ รูปแบบการเขียนสามารถเป็นที่เข้าใจโดยทั่วกันได้
  • Tok Pisin ภาษาที่มีรากฐานมาจากภาษาอังกฤษ หลายคนอาจจะเคยเห็นคำว่า haus ที่แปลว่า บ้าน ซึ่งเห็นคำนี้ก็อาจจะพอเดาได้ เพราะใช้กันอย่างแพร่หลายจริง ๆ และภาษาดังกล่าวถูกใช้เป็นภาษากลางในปาปัวนิวกินีด้วย
ตัวอย่างการแปลภาษา Punjabi

Google คัดเลือกภาษาจากอะไร

Google จะคัดเลือกจากภาษาที่มีผู้ใช้งานเยอะสุดเป็นอันดับต้น ๆ ก่อน เนื่องจากในโลกนี้มีภาษาอยู่มากมาย และมีหลายภาษาที่ไม่ได้มีรูปแบบที่ตายตัว ซึ่งเป็นไปได้ยากที่จะเลือกภาษาจากด้านความถูกต้อง ดังนั้นจึงเลือกที่คนใช้เยอะสุดก่อนนั่นเอง โดยมี PaLM 2 เป็นชิ้นส่วนสำคัญในการช่วยแปลให้มีประสิทธิภาพมากขึ้น ตลอดจนได้ร่วมมือกับนักภาษาศาสตร์และ native speaker ด้วย

ที่มา : Google