เปิดตัว Gemini Omni AI โมเดลตัวตึงด้านวิดีโอ เก็บรายละเอียดเป๊ะขึ้น รองรับ Input หลายรูปแบบ

Gemini Omni โมเดลตัวใหม่ที่รองรับ “Input ทุกรูปแบบ” และมีความสามารถอย่าง “การสร้างได้ทุกอย่างตามที่ผู้ใช้ต้องการ” โดยเปิดตัวเริ่มต้นจากการสร้าง/แก้ไขวิดีโอ ที่เก็บรายละเอียดได้เป๊ะ และมีความต่อเนื่องมากกว่าเดิมจนแยกแทบไม่ออกว่าสร้างจาก AI

Omni Flash สร้างวิดีโอได้เป๊ะจนถูกขนานนามว่า Nano Banana เวอร์ชันวิดีโอ

Omni Flash คือโมเดลรุ่นแรกภายใต้ Gemini Omni ที่ถูกจำกัดความสามารถไว้เฉพาะ “การสร้างหรือแก้ไขวิดีโอ” แตกต่างจากโมเดลประเภทเดียวกันตรงที่ทำได้ทั้ง “สร้างสรรค์วิดีโอ” และ “คิดวิเคราะห์แยกแยะ”

Omni Flash เข้าใจภาษาธรรมชาติ (Natural Language) และสร้างวิดีโอคุณภาพสูงที่รายละเอียดสมจริงได้เป็นอย่างดีด้วยความสามารถของ Gemini

Omni Flash แก้ไขวิดีโอที่มีอยู่แล้วก็ได้

จุดเด่นอย่างหนึ่งของ Omni Flash คือใช้ Input เป็นวิดีโอที่มีอยู่แล้วก็ได้ สามารถแก้ไขผ่านการป้อนคำสั่งในรูปแบบ Conversation ที่ผู้ใช้ไม่จำเป็นต้องรู้ศัพท์ภาพยนต์ก็ได้

โดยตัวอย่างที่ Google นำเสนอว่าสามารถใช้ Omni Flash แก้ไขวิดีโอที่มีอยู่แล้วยังไงได้บ้าง เช่น

เปลี่ยนฉากหลัง
เพิ่มตัวละคร/วัตถุเข้าไปในฉาก
เปลี่ยน/ปรับมุมกล้อง
เปลี่ยนเสียงหรือบทสนทนาในวิดีโอ (อยู่ระหว่างการทดสอบ)

ไม่ต้องเหนื่อย Prompt เยอะ รองรับอินพุตหลายแบบ และต่อเนื่องยิ่งกว่าเดิม

อีกหนึ่ง Highlight ของ Omni Flash ก็คือ “สร้าง/แก้ไขวิดีโอผ่าน Input ได้ทุกรูปแบบ” เช่น รูปภาพ, ข้อความ, วิดีโอ, ไฟล์เสียง แนบไฟล์ทุกรูปแบบพร้อมกันเพื่อให้ AI นำมาสร้างเป็นวิดีโอได้เลย

โดยผลลัพธ์ในแต่ละ Draft ที่ได้ออกมา Omni Flash จะสามารถจดจำคำสั่งก่อนหน้าได้ทั้งหมด เพื่อสร้างวิดีโอออกมาให้มีความต่อเนื่องมากที่สุด และสามารถกำหนดได้ในทุก ๆ รายละเอียด เช่น

ทิศทางการเคลื่อนไหว
เอฟเฟกต์ในฉากหลัง
สไตล์/ลายเส้นในวิดีโอ
การเคลื่อนไหวของวัตถุ/ตัวละครให้เป็นไปตามหลักฟิสิกส์

เพิ่มความปลอดภัยด้วย SynthID ป้องกันไม่ให้ใช้ AI เจน/แก้ไขวิดีโอในทางที่ผิด

Google ระบุว่าชิ้นงานที่ถูกแก้ไข/สร้างโดย Omni Flash จะฝังลายน้ำดิจิทัล (SynthID) ที่มองไม่เห็นด้วยตาเปล่าเอาไว้ด้วย เพื่อใช้ตรวจสอบว่าเป็นวิดีโอที่สร้างด้วย AI หรือเปล่า

ส่วนฟีเจอร์ “แก้ไขเสียงพูดในวิดีโอ” ยังอยู่ในขั้นตอนทดสอบและกำลังหาวิธีที่จะนำมาให้บริการได้อย่างปลอดภัย (เพราะมีความเสี่ยงที่จะถูกนำไปใช้ในทางที่ผิด)

พร้อมให้งานเฉพาะผู้สมัครแพ็กเกจ Google AI Plus, AI Pro และ AI Ultra

Gemini Omni Flash เปิดให้ใช้งานแล้วทั่วโลกตั้งแต่วันนี้ เฉพาะผู้ใช้งานแพ็กเกจ Google AI Plus, AI Pro และ AI Ultra ผ่านแอปฯ Gemini กับ Gemini Flow

และสามารถทดลองใช้โมเดลดังกล่าวเพื่อสร้างสรรค์วิดีโอได้ฟรีบน YouTube Shorts กับ YouTube Create

ที่มา: Google Blog

เปิดตัว Gemini Omni AI โมเดลตัวตึงด้านวิดีโอ เก็บรายละเอียดเป๊ะขึ้น รองรับ Input หลายรูปแบบ

Omni Flash สร้างวิดีโอได้เป๊ะจนถูกขนานนามว่า Nano Banana เวอร์ชันวิดีโอ

Omni Flash แก้ไขวิดีโอที่มีอยู่แล้วก็ได้

ไม่ต้องเหนื่อย Prompt เยอะ รองรับอินพุตหลายแบบ และต่อเนื่องยิ่งกว่าเดิม

เพิ่มความปลอดภัยด้วย SynthID ป้องกันไม่ให้ใช้ AI เจน/แก้ไขวิดีโอในทางที่ผิด

พร้อมให้งานเฉพาะผู้สมัครแพ็กเกจ Google AI Plus, AI Pro และ AI Ultra

Comment

Cancel