Google เปิดตัว Flow เครื่องมือสร้างหนังด้วย AI และอัปเดตโมเดล Veo 3 เจนวิดีโอพร้อมเสียงประกอบ

Google เปิดตัวชุดโมเดล Generative Media เวอร์ชั่นใหม่ในงาน Google I/O 2025 พร้อมอัปเดตโมเดล Veo 3 และ Imagen 4 ไปจนถึงการเปิดตัว Flow เครื่องมือสร้างคลิปวิดีโอในรูปแบบของภาพยนต์ โฆษณาสั้น หรือหนังสั้น ที่ใช้งานง่าย และสามารถกำหนดค่าต่างๆ ได้ละเอียดมากกว่าเดิม

สรุปงาน Google I/O 2025 มีอะไรเปิดตัวใหม่ Gemini เจ๋งขึ้นแค่ไหน มี AI โมเดลใหม่ตัวไหนบ้าง?

Veo 3 โมเดลใหม่ สร้างวิดีโอพร้อมเสียงประกอบ

Veo 3 คือโมเดลสร้างวิดีโอใหม่ล่าสุด และล้ำที่สุดของ Google มีการปรับปรุงคุณภาพของวิดีโอที่สร้างขึ้นให้ดีกว่าเวอร์ชันก่อนหน้าอย่าง Veo 2 พร้อมเปิดตัวความสามารถใหม่ในการสร้างวิดีโอพร้อมเสียงประกอบ (audio generation) เป็นครั้งแรก ทำให้ผู้ใช้เพิ่มเสียงบรรยากาศเพื่อความสมจริงให้กับวิดีโอ เช่น เสียงการจราจร เสียงนกร้อง หรือบทสนทนาของตัวละคร

นอกจากนี้ Veo 3 ยังเป็นโมเดลที่เข้าใจและสามารถจำลองการเคลื่อนไหวตามกฏฟิสิกส์ได้อย่างสมจริง รวมถึงควบคุมการขยับปากของตัวละครได้ด้วยการพิมพ์บทสนทนาเข้าไปในช่องคำสั่ง โดยจะเปิดให้ใช้งานสำหรับผู้ใช้แพ็คเกจ Google AI Ultra ในสหรัฐอเมริกาเป็นที่แรก และจะทยอยเปิดให้ประเทศอื่นๆ ในภายหลัง

ขณะเดียวกันโมเดล Veo 2 ก็ได้รับการอัปเดตบางความสามารถให้ใกล้เคียงกับ Veo 3 เช่น การกำหนดมุมกล้อง, การขยายเฟรม หรือปรับอัตราส่วนวิดีโอตามต้องการ รวมถึงการเพิ่มหรือลบวัตถุในวิดีโอ

Flow เครื่องมือสร้างภาพยนต์ด้วย AI ใช้งานง่าย เก็บดีเทลละเอียด

Flow เป็นเครื่องมือใหม่ที่ออกแบบมาเพื่อช่วยให้การสร้างวิดีโอด้วย AI เป็นเรื่องง่าย และสามารถกำหนดสิ่งต่างๆ ได้ละเอียดตามความต้องการ ผ่านการทำงานร่วมกันของโมเดลหลายตัวไม่ว่าจะเป็น Veo 3, Imagen 4 และ Gemini

จุดเด่นของ Flow คือลดขั้นตอนการทำงานที่ซ้ำซ้อน ช่วยประหยัดเวลา เพราะผู้ใช้สามารถสร้างวิดีโอหลายซีนได้แบบต่อเนื่องในทีเดียว จากที่แต่ก่อนเราจะต้องเจนวิดีโอโอหลายๆ ฉากขึ้นมาแล้วนำวิดีโอทั้งหมดมาต่อกันเอง รองรับการสั่งผ่านข้อความ (Prompt) และการอัปโหลดภาพอ้างอิง (ให้ AI สร้างวิดีโอยึดตามภาพที่เราแนบไป) หรือจะใช้ Imagen 4 เจนภาพแล้วนำมาแปะอีกก็ได้ นอกจากนี้ยังมีฟีเจอร์อื่นๆ ที่น่าสนใจ เช่น

Camera Controls: กำหนดมุม หรือการเคลื่อนไหวของกล้องได้แบบละเอียด
Scenebuilder: ระบบจัดการ Asset และ Prompt อัจฉริยะ ช่วยให้ตัวละครและฉาก (เช่น เสื้อผ้า, หน้าตาตัวละคร, ฉากหลัง) มีความต่อเนื่องสอดคล้องกันตลอดทั้งโปรเจกต์ ลดปัญหารายละเอียดเพี้ยนระหว่างซีน
Flow TV: ฟีเจอร์สำหรับดูตัวอย่างคลิปของครีเอเตอร์คนอื่นๆ พร้อมกับ Prompt ที่ใช้งาน เพื่อนำมาต่อยอดไอเดียของเรา

Flow เปิดให้ใช้งานแล้วสำหรับคนที่สมัครแพ็คเกจ Google AI Pro (ใช้งานได้ 100 ครั้ง/เดือน) และ AI Ultra (ใช้งานได้ไม่จำกัด) ในสหรัฐอเมริกา ส่วนประเทศอื่นจะทยอยเปิดให้ใช้งานอีกไม่กี่เดือนข้างหน้า

Imagen 4 ทำงานเร็วขึ้น เจนภาพความละเอียดสูง

โมเดล Imagen 4 ได้รับการอัปเกรดประสิทธิภาพให้สร้างรูปภาพได้เร็วขึ้นกว่า Imagen 3 ถึง 10 เท่า พร้อมความสามารถในการสร้างรายละเอียดพื้นผิวที่มีความคมชัด เช่น หยดน้ำ ขนสัตว์ และผืนผ้า รองรับทั้งภาพแบบสมจริง (photorealistic) และภาพวาด (abstract) สร้างภาพได้หลายอัตราส่วน ด้วยความละเอียดสูงสุด 2K รวมถึงยังมีความสามารถในการสร้างคำหรือตัวอักษรที่แม่นยำกว่าเดิม เหมาะกับการใช้ทำโปสเตอร์ หรือชิ้นงานที่มีตัวอักษรเยอะๆ

Lyria RealTime โมเดล AI สร้างเสียงดนตรีแบบเรียลไทม์

AI สร้างเพลงและเสียงอย่าง Lyria 2 ที่เดิมทีจำกัดการใช้งานเฉพาะนักพัฒนาหรือผู้ใช้บางกลุ่ม ตอนนี้ได้ขยายให้เข้าถึงผู้ใช้งานที่มากขึ้น ในรูปแบบของฟีเจอร์ใหม่บน YouTube Shorts ที่สามารถเลือกสร้างเพลงหรือเสียงประกอบได้ตามต้องการ นอกจากนี้ Google ยังได้เปิดตัวโมเดลสร้างดนตรีแบบอินเทอร์แอคทีฟ Lyria RealTime ให้ผู้ใช้งานทั่วไปได้เข้าไปทดลองใช้บน Google AI Studio โดยผู้ใช้จะสามารถโต้ตอบหรือปรับแต่งเสียงดนตรีได้แบบเรียลไทม์

SynthID Detectorc เครื่องมือตรวจสอบผลงานที่ถูกสร้างด้วย AI

และเพื่อเป็นการส่งเสริมการใช้งาน AI อย่างปลอดภัย Google เลยได้เปิดตัว SynthID Detector เทคโนโลยีตรวจสอบไฟล์หรือผลงานที่ถูกสร้างด้วย AI ของ Google อย่าง Veo 3, Imagen 4 และ Lyria 2 ซึ่งจะมี SynthID ลายน้ำดิจิทัลที่มองไม่เห็นฝังอยู่ ป้องกันการนำผลงานไปใช้ในทางที่ผิด ในตอนนี้ SynthID Detector ยังอยู่ในขั้นตอนทดสอบกับกลุ่มผู้ใช้บางส่วนเท่านั้น