เว็บไซต์ Proof และ Wired เผยแพร่บทความรายงานการตรวจสอบบริษัทเทคโนโลยียักษ์ใหญ่หลายแห่ง นำโดย Apple, Anthropic, Nvidia และ Salesforce ที่ถูกพบว่ามีการนำข้อมูลซับไตเติลของ YouTube ไปใช้เทรนโมเดล AI โดยไม่ได้รับอนุญาต โดยมีวิดีโอที่ถูกละเมิดกว่า 170,000 คลิป จาก 48,000 ช่อง ซึ่งในจำนวนนี้มียูทูบเบอร์ชื่อดัง MrBeast, PewDiePie และ MKBHD รวมอยู่ด้วย รวมถึงสำนักข่าวใหญ่ ๆ เช่น The Wall Street Journal, NPR และ BBC เป็นต้น

MKBHD ออกมาวิจารณ์ถึงประเด็นนี้ โดยให้ความเห็นว่า เจ้าตัวต้องจ่ายเงินให้กับผู้ให้บริการถอดเสียงเป็นข้อความแบบนาทีต่อนาที เพื่อให้ซับไตเติลของวิดีโอออกมามีความเที่ยงตรงถูกต้องมากที่สุด ในขณะที่บริษัทเหล่านี้กลับ ‘ขโมย’ ข้อมูลไปใช้กันดื้อ ๆ ซึ่งไม่ใช่เรื่องที่ดีเลยสักนิดเดียว

อย่างไรก็ดี Wired แจ้งว่า Apple, Anthropic, Nvidia, Salesforce และบริษัทอื่น ๆ ไม่ได้นำข้อมูลของ YouTube ไปใช้งานโดยตรง หากแต่รับชุดข้อมูลมาจาก The Pile ที่จัดทำโดยองค์กรไม่แสวงผลกำไร EleutherAI อีกทอด ซึ่งในชุดข้อมูลนี้ยังเก็บรวบรวมบทความจาก Wikipedia เอาไว้ด้วย

ในขณะที่ Sundar Pichai ซีอีโอของ Google และ Neal Mohan ซีอีโอของ YouTube ยืนยันตรงกันผ่านการให้สัมภาษณ์กับ Bloomberg ไปตั้งแต่ก่อนหน้านี้ว่า การนำข้อมูลจาก YouTube ไปใช้เทรนโมเดล AI ถือเป็นการละเมิดนโยบายของแพลตฟอร์ม ดังนั้นคงต้องติดตามดูต่อไปว่า ทั้ง 2 ฝ่ายจะดำเนินการอย่างไรนับจากนี้ ทั้ง YouTube ที่เป็นผู้ถูกละเมิด และบรรดาบริษัทบิ๊กเทคฯ ที่นำข้อมูลไปใช้งานโดยไม่ขอ

ที่มา : Proof | Wired