DeepSeek เปิดต่อไม่รอแล้วนะ เสียงฮือฮาตัวแอป และโมเดล DeepSeek-R1 ยังไม่ทันเงียบ ก็ปล่อย Janus-Pro โมเดล AI ตัวใหม่ ซึ่งเป็นแบบ Multimodal สามารถสั่งทั้งวิเคราห์ข้อมูลทั่วไปทั้งจากข้อความ ภาพ หรือเสียงได้ รวมถึงยังสั่งให้สร้างภาพได้ แถมยังสามารถใช้เชิงพาณิชย์ได้โดยไม่มีข้อจำกัด

Janus-Pro AI สร้างภาพตัวใหม่

Janus-Pro มีอยู่ 2 ขนาด คือ

  • Janus-Pro-1B (1 พันล้านพารามิเตอร์ )
  • Janus-Pro-7B (7 พันล้านพารามิเตอร์)

นอกจากนี้ ยังมีพี่น้อง Janus แยกซีรีส์อีก 2 ตัว คือ Janus-1.3B และ JanusFlow-1.3B

Janus-Pro เป็น AI แบบ Multimodal คือที่สามารถประมวลผลและรวมข้อมูลจากหลายรูปแบบในการทำงาน ทั้งข้อความ และภาพถ่าย แล้วยังสามารถสร้างภาพได้ด้วย

จากผลทดสอบด้วยชุดทดสอบ GenEval และ DPG-Bench พบว่าโมเดล Janus-Pro ที่ใหญ่ที่สุด Janus-Pro-7B สามารถเอาชนะ DALL-E 3, PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ได้

Janus-Pro test

เทียบการสร้างภาพ แบบ text-to-image ของ Janus รุ่นแรก กับ Janus-Pro-7B ในคำสั่งเดียวกัน ได้มีการพัฒนาขึ้นมา แต่ว่าตอนนี้สร้างรูปภาพได้เพียงขนาดเล็ก มีความละเอียดสูงสุด 384 x 384 พิกเซล เท่านั้น แต่ประสิทธิภาพของ Janus-Pro ถือว่าน่าประทับใจ พัฒนาได้เร็ว เมื่อเทียบกับรุ่นแรก

janus_pro

และอีกข้อดีของ Janus-Pro อยู่ภายใต้ใบอนุญาต MIT หมายความว่าสามารถใช้ในเชิงพาณิชย์ได้โดยไม่มีข้อจำกัด

ใครที่สนใจ สามารถเข้าไปดาวน์โหลดและอ่านข้อมูลเพิ่มเติมได้ที่ >> Github