ChatGPT มีลูกเล่นใหม่ที่น่าสนใจในชื่อ Advanced Voice Mode ออกมา โดยตอนนี้สามารถใช้งานร่วมกับแชร์วิดีโอบนหน้าจอได้แล้ว โดยฟีเจอร์นี้ถูกเปิดตัวครั้งแรกเมื่อเดือนพฤษภาคมปีที่แล้วตอนที่เปิดตัว GPT-4o แต่ตอนนั้นยังรองรับเพียงโหมดเสียงเท่านั้น ซึ่งล่าสุดตอนนี้ ผู้ใช้สามารถแชทกับ ChatGPT โดยใช้กล้องโทรศัพท์ และระบบจะเห็นเหมือนกับที่เราเห็นจริงแบบ real-time ได้

ตามคลิป Day 6 ของ OpenAI ที่ถ่ายทอดสดโดย CPO นาย Kevin Weil และสมาชิกทีม OpenAI คนอื่นๆ มีการสาธิต ChatGPT ในโหมด Advanced Voice โดยผู้ชายในคลิปจะวางชุดชงกาแฟแบบดริป ซึ่งเมื่อเล็งกล้องไปที่ชุดชงกาแฟ ระบบจะถามว่าคุณกำลังจะชมกาแฟเหรอ เขาก็บอกว่าให้ ChatGPT แนะนำวิธีชงกาแฟซึ่งระบบ Advanced Voice สามารถเข้าใจหลักการของเครื่องชงกาแฟอย่างระเอียด และอธิบายให้ทีมงานได้ทำตาม

OpenAI เปิดตัว Advanced Voice Mode สำหรับการแชร์หน้าจอ และ Santa Mode สำหรับคนที่อยากคุยกับซานต้า

นอกจากนี้ ทีมงานยังได้แสดงให้เห็นว่า ChatGPT สามารถดูหน้าจอที่เรากำลังเปิดอยู่ และสามารถช่วยเลือกคำตอบสำหรับแชตที่เข้ามา พร้อมมีมุกตลกเกี่ยวกับ Weil ที่สวมหนวดซานต้าให้ไปฝึกหัวเราะแบบซานต้า และฝึกแสดงให้เหมือนซานต้าเพื่อที่จะแสดงเป็นซานต้าให้เหมือนมากขึ้นอีกด้วย

จังหวะเหมาะพอดีที่ OpenAI เลือกที่จะเปิดตัวฟีเจอร์นี้ หนึ่งวันหลังจากที่ Google เปิดตัว AI รุ่นเรือธงรุ่นต่อไป คือ Gemini 2.0 ที่สามารถประมวลผลอินพุตภาพและเสียงได้ และมีขีดความสามารถของตัวแทน AI Agent ที่มากขึ้น ซึ่งทำงานหลายขั้นตอนในนามของผู้ใช้ได้ และฟีเจอร์ Agent ของ Gemini 2.0 ยังอยู่ในขั้นตอนการวิจัย โดยแบ่งเป็น 3 กลุ่มหลัก ๆ คือ Project Astra ซึ่งเป็นผู้ช่วย AI แบบ universal, Project Mariner สำหรับทำงาน AI โดยเฉพาะ และ Project Jules สำหรับนักพัฒนา

การสาธิตของ OpenAI แสดงให้เห็นว่าการมองเห็นของ ChatGPT สามารถระบุวัตถุได้อย่างแม่นยำเพียงใด, ขัดจังหวะได้ และยังสามารถเปลี่ยนเสียงเป็นเสียงของซานต้า ซึ่งมีเสียงทุ้มและร่าเริง พร้อมกับหัวเราะ “โฮ-โฮ-โฮ” ได้เช่นกัน ซึ่งผู้ใช้สามารถแชทกับซานต้าเวอร์ชันของ OpenAI ได้โดยแตะไอคอนเกล็ดหิมะใน ChatGPT แต่ที่แปลกใจก็คือ เมื่อเลือกเสียงของซานต้าในแอป ChatGPT ผู้ใช้จะได้รับคำเตือนว่า เสียงนี้มีไว้สำหรับผู้ใช้ที่มีอายุ 13 ปีขึ้นไปเท่านั้น

โดยผู้ใช้ ChatGPT Plus และ Pro สามารถใช้วิดีโอและแชร์หน้าจอได้ตั้งแต่วันนี้เป็นต้นไป และจะพร้อมใช้งานสำหรับกลุ่ม Enterprise และ Edu ในเดือนมกราคม 2025 ที่จะถึงนี้

ที่มา openai