Imagen 3 โมเดลสร้างรูปภาพจากข้อความ (text-to-image) ที่ดีที่สุดและล้ำหน้าที่สุดของกูเกิล เปิดให้ผู้ใช้งานทั่วไปสามารถเข้าถึงได้แล้วผ่าน AI Test Kitchen บน ImageFX โดยเริ่มจากสหรัฐฯ เป็นที่แรก จากที่ก่อนหน้านี้จำกัดสิทธิ์การใช้งานเฉพาะลูกค้า Vertex AI มาตั้งแต่เดือนมิถุนายน
Imagen 3 เป็นโมเดลเวอร์ชันอัปเกรดของ Imagen 2 ที่กูเกิลเคลมว่ามีประสิทธิภาพดีขึ้นอย่างมากในหลาย ๆ แง่มุม โดยเฉพาะการเข้าใจภาษาที่เป็นธรรมชาติ และการเข้าใจรานละเอียดเล็ก ๆ น้อย ๆ จาก prompt ที่เป็นประโยคยาว ๆ หรือต่อเนื่องกัน ส่งผลให้สามารถนำโมเดลไปต่อยอดกับงานเฉพาะทางได้ นอกจากนี้ Imagen 3 ยังสามารถเรนเดอร์ข้อความ – ตัวอักษร บนภาพ ได้แม่นยำกว่าเดิมด้วย
เครื่องมือสร้างรูปภาพ Pixel Studio ที่กูเกิลเปิดตัวพร้อม Pixel 9 และ Pixel 9 Pro ในสัปดาห์นี้ ก็ขับเคลื่อนด้วยพลังของ Imagen 3 เช่นกัน ซึ่งกรณีนี้จะเป็นการประมวลผลแบบ on-device จากบนตัวอุปกรณ์ และแน่นอนว่าเป็นฟีเจอร์เอกซ์คลูซีฟเฉพาะ Pixel 9 series เท่านั้น
ที่มา : Google DeepMind ผ่าน Altruistic_Gibbon907
Comment