DeepSeek เปิดต่อไม่รอแล้วนะ เสียงฮือฮาตัวแอป และโมเดล DeepSeek-R1 ยังไม่ทันเงียบ ก็ปล่อย Janus-Pro โมเดล AI ตัวใหม่ ซึ่งเป็นแบบ Multimodal สามารถสั่งทั้งวิเคราห์ข้อมูลทั่วไปทั้งจากข้อความ ภาพ หรือเสียงได้ รวมถึงยังสั่งให้สร้างภาพได้ แถมยังสามารถใช้เชิงพาณิชย์ได้โดยไม่มีข้อจำกัด
Janus-Pro AI สร้างภาพตัวใหม่
Janus-Pro มีอยู่ 2 ขนาด คือ
- Janus-Pro-1B (1 พันล้านพารามิเตอร์ )
- Janus-Pro-7B (7 พันล้านพารามิเตอร์)
นอกจากนี้ ยังมีพี่น้อง Janus แยกซีรีส์อีก 2 ตัว คือ Janus-1.3B และ JanusFlow-1.3B
Janus-Pro เป็น AI แบบ Multimodal คือที่สามารถประมวลผลและรวมข้อมูลจากหลายรูปแบบในการทำงาน ทั้งข้อความ และภาพถ่าย แล้วยังสามารถสร้างภาพได้ด้วย
จากผลทดสอบด้วยชุดทดสอบ GenEval และ DPG-Bench พบว่าโมเดล Janus-Pro ที่ใหญ่ที่สุด Janus-Pro-7B สามารถเอาชนะ DALL-E 3, PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ได้

เทียบการสร้างภาพ แบบ text-to-image ของ Janus รุ่นแรก กับ Janus-Pro-7B ในคำสั่งเดียวกัน ได้มีการพัฒนาขึ้นมา แต่ว่าตอนนี้สร้างรูปภาพได้เพียงขนาดเล็ก มีความละเอียดสูงสุด 384 x 384 พิกเซล เท่านั้น แต่ประสิทธิภาพของ Janus-Pro ถือว่าน่าประทับใจ พัฒนาได้เร็ว เมื่อเทียบกับรุ่นแรก

และอีกข้อดีของ Janus-Pro อยู่ภายใต้ใบอนุญาต MIT หมายความว่าสามารถใช้ในเชิงพาณิชย์ได้โดยไม่มีข้อจำกัด
ใครที่สนใจ สามารถเข้าไปดาวน์โหลดและอ่านข้อมูลเพิ่มเติมได้ที่ >> Github
Comment