บริษัท xAI นำโดย Elon Musk ได้เปิดตัวโมเดล AI รุ่นใหม่ล่าสุด Grok 4 และ Grok 4 Heavy อย่างเป็นทางการ พร้อมเปิดตัวแพ็กเกจสมัครใช้งาน AI ระดับสูงสุด SuperGrok Heavy ในราคาสูงถึง 300 ดอลลาร์ต่อเดือน (ราว 9,700 บาท) ซึ่งนับว่าสูงที่สุดในตลาด เมื่อเทียบกับแผนสมัครแบบพรีเมียมของ OpenAI, Google หรือ Anthropic

Grok 4 และ Grok 4 Heavy เจ๋งแค่ไหน ฉลาดจริงหรือโม้?

Grok 4

Grok 4 รุ่นล่าสุด ถูกพัฒนาให้ฉลาดขึ้นอย่างมาก เพื่อรองรับการทำงานระดับ “PhD” ทุกแขนงวิชา มาพร้อมเครื่องมือพื้นฐานและการรวมระบบค้นหาแบบเรียลไทม์ แล้วยังตอบสนองได้ดีขึ้นและเป็นธรรมชาติมากขึ้นในโหมดเสียง

โดยใช้เทคนิคการฝึกแบบ Reinforcement Learning (RL) ในระดับที่ไม่เคยมีมาก่อน ใช้คลัสเตอร์ GPU ขนาดมหึมา “Colossus” ที่มีมากถึง 200,000 ตัว สำหรับการเทรนในระดับ pretraining scale

Grok 4 ยังได้รับการขยายชุดข้อมูลฝึก (training data) จากเดิมที่เน้นเฉพาะด้านคณิตศาสตร์และการเขียนโปรแกรม ไปสู่ข้อมูลที่หลากหลายมากขึ้น ทั้งในด้านตรรกะ ภาษา วิทยาศาสตร์ และโดเมนอื่น ๆ ที่มีข้อมูลที่ตรวจสอบได้ (verifiable data)

เพิ่มประสิทธิภาพการฝึก 6 เท่า ด้วยการพัฒนาทั้งระบบ

และไม่ได้เพิ่มแค่จำนวน GPU เท่านั้น แต่ยังได้พัฒนา นวัตกรรมในทุกระดับของระบบ ไม่ว่าจะเป็น

  • โครงสร้างพื้นฐานใหม่ (infrastructure) ที่รองรับการประมวลผลระดับมหาศาล
  • อัลกอริธึมใหม่ ที่ช่วยให้การฝึกใช้ทรัพยากรได้อย่างมีประสิทธิภาพมากขึ้น
  • การปรับปรุงระบบการคำนวณให้มี ประสิทธิภาพสูงขึ้นถึง 6 เท่า เทียบกับก่อนหน้านี้

ใช้เครื่องมือได้อย่างเป็นธรรมชาติ

การฝึกด้วย Reinforcement Learning (RL) เพื่อให้โมเดล “ใช้เครื่องมือ” ได้ด้วยตัวเอง หรือที่เรียกว่า Native Tool Use ซึ่งช่วยเสริมพลังการคิดและวิเคราะห์

Grok 4 สามารถเรียกใช้เครื่องมือได้อย่างเป็นธรรมชาติ เช่น

  • ตัวแปลรหัส (code interpreter) เพื่อช่วยคิดคำนวณ วิเคราะห์ข้อมูล หรือประมวลผลตามโจทย์ที่ได้รับ
  • การค้นเว็บแบบเรียลไทม์ (web browsing) เพื่อหาข้อมูลอัปเดตที่ไม่ได้อยู่ในชุดข้อมูลฝึก

ยกตัวอย่าง เมื่อได้รับคำถามที่ต้องอิงข้อมูลล่าสุด หรือคำถามที่ซับซ้อนเชิงวิจัย Grok 4 มีขั้นตอนในการหาคำตอบ ดังนี้

  1. สร้างคำค้น (search queries) ของตัวเอง
  2. สืบค้นข้อมูลจากเว็บ อย่างมีเป้าหมาย
  3. วิเคราะห์และสรุป คำตอบคุณภาพสูง ที่อ้างอิงจากข้อมูลจริง

นอกจากการหาข้อมูลจากเว็บทั่วไปแล้ว Grok 4 ยังถูกฝึกให้ใช้เครื่องมือที่เข้าถึงข้อมูลลึกภายใน แพลตฟอร์ม X เช่น การค้นหาด้วยคีย์เวิร์ดและความหมาย (keyword & semantic search) เพื่อเข้าใจทั้งคำตรงตัวและนัยแฝงของข้อความ, การดูสื่อ (media viewing) เช่น ภาพหรือวิดีโอ เพื่อประกอบการวิเคราะห์และตอบคำถามได้ครอบคลุมมากขึ้น

Grok 4 ไม่ใช่แค่โมเดลที่ตอบคำถามได้จากความรู้เดิมที่ฝึกมา แต่เป็นโมเดลที่รู้ว่าเมื่อไหร่ควรใช้เครื่องมือ เลือกเครื่องมือให้เหมาะกับงาน และใช้เครื่องมือได้อย่างคล่องแคล่วเหมือนมนุษย์

ซึ่ง Elon Musk กล่าวอย่างมั่นใจว่า “ในด้านคำถามเชิงวิชาการ Grok 4 เก่งระดับดีกรีปริญญาเอกในทุกสาขา แบบไม่มีข้อยกเว้น… แม้บางครั้งจะยังขาดสามัญสำนึก และยังไม่ได้ค้นพบฟิสิกส์ใหม่ ๆ แต่เรื่องนั้นมันแค่เรื่องของเวลา”

Grok 4 Heavy

นอกจากนี้ ยังมี Grok 4 Heavy เป็นเวอร์ชัน “multi-agent” มีคุณสมบัติเด่นคือการสร้างหลายเอเจนต์ทำงานร่วมกัน เหมือนกลุ่มติวเตอร์ ที่ช่วยกันหาคำตอบที่ดีที่สุด

Grok 4 Heavy

ผลทดสอบประสิทธิภาพ (Benchmark)

Grok 4 และ Grok 4 Heavy

จากกราฟผลทดสอบในภาพ Grok 4 และ Grok 4 Heavy ทำผลงานได้โดดเด่นเหนือคู่แข่งในหลายการทดสอบ เช่น

  • GPQA (General Professional Qualification Assessment)
    • Grok 4 : 87.5%
    • Grok 4 Heavy: 88.9%
    • ชนะ Claude 4 Opus (79.6%) และ GPT-4 (83.3%)
  • AIME25 (American Invitational Mathematics Examination)
    • Grok 4 Heavy: 100%, Grok 4: 98.8%
    • ดีกว่า Claude 4 Opus (75.5%) และ Gemini 2.5 Pro (88.0%)
  • HMMT25 (Harvard-MIT Math Tournament)
    • Grok 4 Heavy: 96.7%
    • สูงกว่า GPT-4 (77.5%) และ Claude 4 Opus (58.3%)
  • USAMO25 (USA Math Olympiad)
    • Grok 4 Heavy: 61.9%
    • ทิ้งห่าง Gemini DeepThink (49.4%) และ GPT-4 (37.5%)
  • LCB (Jan-May)
    • Grok 4 Heavy: 79.4%
    • ชนะ GPT-4 และ Gemini ทุกรุ่นในช่วงเวลาเดียวกัน

คะแนนบน Humanity’s Last Exam และ ARC-AGI-2

Grok 4

xAI เผยว่า Grok 4 ได้คะแนน 25.4% บนการทดสอบ Humanity’s Last Exam (แบบไม่ใช้เครื่องมือ) ซึ่งสูงกว่า GPT-4 (o3 high) ที่ได้ 21% และ Gemini 2.5 Pro ได้ 21.6% และเมื่อใช้เครื่องมือเสริม Grok 4 Heavy ทำได้ถึง 44.4% ขณะที่ Gemini 2.5 Pro ทำได้เพียง 26.9%

Grok 4

นอกจากนี้ Grok 4 ยังทำคะแนนสูงสุดใหม่ใน ARC-AGI-2 ซึ่งเป็นการทดสอบความเข้าใจลวดลายภาพและตรรกะที่ซับซ้อน โดยได้คะแนนถึง 15.9% มากกว่า Claude Opus 4 ซึ่งเป็นอันดับสองเกือบเท่าตัว ที่ทำได้เพียง ~8.6%

ส่วน Grok 4 จะฉลาดจริงดังคำเคลมจากค่าย หรือเวลาใช้งานจริงตรงตามผลทดสอบหรือไม่ ก็สามารถไปเทสต์กันได้ เพราะตอนนี้ได้เปิดให้ใช้งานแล้ว สำหรับสมาชิก SuperGrok และ Premium+

อนาคตของ xAI

xAI วางแผนเปิดตัว โมเดลต่างๆ ในปี 2025 ดังนี้

  • โมเดล AI ด้านการเขียนโค้ด : สิงหาคม
  • ผู้ช่วยแบบมัลติโหมด (Multimodal Agent) : กันยายน
  • โมเดลสร้างวิดีโอ (Video Generation) : ตุลาคม

Grok 4 ยังเปิดให้ใช้งานผ่าน API โดย xAI มุ่งหวังให้เหล่านักพัฒนาและองค์กรนำไปสร้างแอปพลิเคชันของตนเอง โดยขณะนี้ฝ่าย Enterprise ของ xAI เพิ่งเปิดตัวได้เพียง 2 เดือน และอยู่ระหว่างการทำงานร่วมกับผู้ให้บริการคลาวด์ขนาดใหญ่ (Hyperscalers)

ทั้งนี้ Grok ถูกวิจารณ์หนักจากการแสดงความเห็นเชิงต่อต้านชาวยิวบนแพลตฟอร์ม X ซึ่ง xAI ต้องลบโพสต์และจำกัดบัญชี Grok ชั่วคราว พร้อมถอดคำสั่งใน System Prompt ที่ระบุให้ AI “ไม่หลีกเลี่ยงการพูดประเด็นไม่ถูกต้องทางการเมือง”

และในวันเดียวกับการเปิดตัว Grok 4 ยังมีเหตุการณ์สำคัญคือ Linda Yaccarino ลาออกจากตำแหน่ง CEO ของ X โดยไม่มีการแต่งตั้งผู้สืบตำแหน่งในทันที

ทั้งนี้ แม้ตอนนี้ทาง xAI พยายามชูด้านความฉลาดและอิสระในการใช้งาน ผลเทสต์ทิ้งห่างคู่แข่งหลายด้าน แต่ว่าจะได้รับน่าเชื่อถือจากผู้ใช้งานหรือไม่ ก็ยังเป็นคำถามที่ต้องรอคำตอบ และยิ่งเร็ว ๆ นี้ GPT-5 จาก OpenAI กำลังจะเปิดตัว ผลทดสอบ Grok 4 จะยังเจ๋งกว่าอยู่ไหม?

แพ็กเกจบริการ AI : SuperGrok Heavy ราคาเกือบหมื่น

แพ็กเกจ SuperGrok Heavy จะมีราคา 300 ดอลลาร์/เดือน (ราว 9,700 บาท)

  • จะเปิดให้เข้าถึง Grok 4 Heavy แบบพรีวิว และฟีเจอร์ใหม่ ๆ ล่วงหน้า ก่อนใคร
  • รองรับโมเดลใหม่ที่กำลังจะเปิดตัว เช่น
    • โมเดล AI ด้านการเขียนโค้ด : สิงหาคม
    • Multimodal Agent : กันยายน
    • โมเดลสร้างวิดีโอ (Video Generation) : ตุลาคม

ที่มา : xAI, techcrunch