ทำไม อีลอน ถึงกล้าเคลม Grok 4 คือ AI ฉลาดที่สุดในโลก? พร้อมเปิดตัวแพ็กเกจ AI ใหม่ SuperGrok Heavy เดือนละเกือบหมื่น

บริษัท xAI นำโดย Elon Musk ได้เปิดตัวโมเดล AI รุ่นใหม่ล่าสุด Grok 4 และ Grok 4 Heavy อย่างเป็นทางการ พร้อมเปิดตัวแพ็กเกจสมัครใช้งาน AI ระดับสูงสุด SuperGrok Heavy ในราคาสูงถึง 300 ดอลลาร์ต่อเดือน (ราว 9,700 บาท) ซึ่งนับว่าสูงที่สุดในตลาด เมื่อเทียบกับแผนสมัครแบบพรีเมียมของ OpenAI, Google หรือ Anthropic

Grok 4 และ Grok 4 Heavy เจ๋งแค่ไหน ฉลาดจริงหรือโม้?

Grok 4 รุ่นล่าสุด ถูกพัฒนาให้ฉลาดขึ้นอย่างมาก เพื่อรองรับการทำงานระดับ “PhD” ทุกแขนงวิชา มาพร้อมเครื่องมือพื้นฐานและการรวมระบบค้นหาแบบเรียลไทม์ แล้วยังตอบสนองได้ดีขึ้นและเป็นธรรมชาติมากขึ้นในโหมดเสียง

โดยใช้เทคนิคการฝึกแบบ Reinforcement Learning (RL) ในระดับที่ไม่เคยมีมาก่อน ใช้คลัสเตอร์ GPU ขนาดมหึมา “Colossus” ที่มีมากถึง 200,000 ตัว สำหรับการเทรนในระดับ pretraining scale

Grok 4 ยังได้รับการขยายชุดข้อมูลฝึก (training data) จากเดิมที่เน้นเฉพาะด้านคณิตศาสตร์และการเขียนโปรแกรม ไปสู่ข้อมูลที่หลากหลายมากขึ้น ทั้งในด้านตรรกะ ภาษา วิทยาศาสตร์ และโดเมนอื่น ๆ ที่มีข้อมูลที่ตรวจสอบได้ (verifiable data)

เพิ่มประสิทธิภาพการฝึก 6 เท่า ด้วยการพัฒนาทั้งระบบ

และไม่ได้เพิ่มแค่จำนวน GPU เท่านั้น แต่ยังได้พัฒนา นวัตกรรมในทุกระดับของระบบ ไม่ว่าจะเป็น

โครงสร้างพื้นฐานใหม่ (infrastructure) ที่รองรับการประมวลผลระดับมหาศาล
อัลกอริธึมใหม่ ที่ช่วยให้การฝึกใช้ทรัพยากรได้อย่างมีประสิทธิภาพมากขึ้น
การปรับปรุงระบบการคำนวณให้มี ประสิทธิภาพสูงขึ้นถึง 6 เท่า เทียบกับก่อนหน้านี้

ใช้เครื่องมือได้อย่างเป็นธรรมชาติ

การฝึกด้วย Reinforcement Learning (RL) เพื่อให้โมเดล “ใช้เครื่องมือ” ได้ด้วยตัวเอง หรือที่เรียกว่า Native Tool Use ซึ่งช่วยเสริมพลังการคิดและวิเคราะห์

Grok 4 สามารถเรียกใช้เครื่องมือได้อย่างเป็นธรรมชาติ เช่น

ตัวแปลรหัส (code interpreter) เพื่อช่วยคิดคำนวณ วิเคราะห์ข้อมูล หรือประมวลผลตามโจทย์ที่ได้รับ
การค้นเว็บแบบเรียลไทม์ (web browsing) เพื่อหาข้อมูลอัปเดตที่ไม่ได้อยู่ในชุดข้อมูลฝึก

ยกตัวอย่าง เมื่อได้รับคำถามที่ต้องอิงข้อมูลล่าสุด หรือคำถามที่ซับซ้อนเชิงวิจัย Grok 4 มีขั้นตอนในการหาคำตอบ ดังนี้

สร้างคำค้น (search queries) ของตัวเอง
สืบค้นข้อมูลจากเว็บ อย่างมีเป้าหมาย
วิเคราะห์และสรุป คำตอบคุณภาพสูง ที่อ้างอิงจากข้อมูลจริง

นอกจากการหาข้อมูลจากเว็บทั่วไปแล้ว Grok 4 ยังถูกฝึกให้ใช้เครื่องมือที่เข้าถึงข้อมูลลึกภายใน แพลตฟอร์ม X เช่น การค้นหาด้วยคีย์เวิร์ดและความหมาย (keyword & semantic search) เพื่อเข้าใจทั้งคำตรงตัวและนัยแฝงของข้อความ, การดูสื่อ (media viewing) เช่น ภาพหรือวิดีโอ เพื่อประกอบการวิเคราะห์และตอบคำถามได้ครอบคลุมมากขึ้น

Grok 4 ไม่ใช่แค่โมเดลที่ตอบคำถามได้จากความรู้เดิมที่ฝึกมา แต่เป็นโมเดลที่รู้ว่าเมื่อไหร่ควรใช้เครื่องมือ เลือกเครื่องมือให้เหมาะกับงาน และใช้เครื่องมือได้อย่างคล่องแคล่วเหมือนมนุษย์

ซึ่ง Elon Musk กล่าวอย่างมั่นใจว่า “ในด้านคำถามเชิงวิชาการ Grok 4 เก่งระดับดีกรีปริญญาเอกในทุกสาขา แบบไม่มีข้อยกเว้น… แม้บางครั้งจะยังขาดสามัญสำนึก และยังไม่ได้ค้นพบฟิสิกส์ใหม่ ๆ แต่เรื่องนั้นมันแค่เรื่องของเวลา”

Grok 4 Heavy

นอกจากนี้ ยังมี Grok 4 Heavy เป็นเวอร์ชัน “multi-agent” มีคุณสมบัติเด่นคือการสร้างหลายเอเจนต์ทำงานร่วมกัน เหมือนกลุ่มติวเตอร์ ที่ช่วยกันหาคำตอบที่ดีที่สุด

ผลทดสอบประสิทธิภาพ (Benchmark)

จากกราฟผลทดสอบในภาพ Grok 4 และ Grok 4 Heavy ทำผลงานได้โดดเด่นเหนือคู่แข่งในหลายการทดสอบ เช่น

GPQA (General Professional Qualification Assessment)
- Grok 4 : 87.5%
- Grok 4 Heavy: 88.9%
- ชนะ Claude 4 Opus (79.6%) และ GPT-4 (83.3%)
AIME25 (American Invitational Mathematics Examination)
- Grok 4 Heavy: 100%, Grok 4: 98.8%
- ดีกว่า Claude 4 Opus (75.5%) และ Gemini 2.5 Pro (88.0%)
HMMT25 (Harvard-MIT Math Tournament)
- Grok 4 Heavy: 96.7%
- สูงกว่า GPT-4 (77.5%) และ Claude 4 Opus (58.3%)
USAMO25 (USA Math Olympiad)
- Grok 4 Heavy: 61.9%
- ทิ้งห่าง Gemini DeepThink (49.4%) และ GPT-4 (37.5%)
LCB (Jan-May)
- Grok 4 Heavy: 79.4%
- ชนะ GPT-4 และ Gemini ทุกรุ่นในช่วงเวลาเดียวกัน

คะแนนบน Humanity’s Last Exam และ ARC-AGI-2

xAI เผยว่า Grok 4 ได้คะแนน 25.4% บนการทดสอบ Humanity’s Last Exam (แบบไม่ใช้เครื่องมือ) ซึ่งสูงกว่า GPT-4 (o3 high) ที่ได้ 21% และ Gemini 2.5 Pro ได้ 21.6% และเมื่อใช้เครื่องมือเสริม Grok 4 Heavy ทำได้ถึง 44.4% ขณะที่ Gemini 2.5 Pro ทำได้เพียง 26.9%

นอกจากนี้ Grok 4 ยังทำคะแนนสูงสุดใหม่ใน ARC-AGI-2 ซึ่งเป็นการทดสอบความเข้าใจลวดลายภาพและตรรกะที่ซับซ้อน โดยได้คะแนนถึง 15.9% มากกว่า Claude Opus 4 ซึ่งเป็นอันดับสองเกือบเท่าตัว ที่ทำได้เพียง ~8.6%

ส่วน Grok 4 จะฉลาดจริงดังคำเคลมจากค่าย หรือเวลาใช้งานจริงตรงตามผลทดสอบหรือไม่ ก็สามารถไปเทสต์กันได้ เพราะตอนนี้ได้เปิดให้ใช้งานแล้ว สำหรับสมาชิก SuperGrok และ Premium+

อนาคตของ xAI

xAI วางแผนเปิดตัว โมเดลต่างๆ ในปี 2025 ดังนี้

โมเดล AI ด้านการเขียนโค้ด : สิงหาคม
ผู้ช่วยแบบมัลติโหมด (Multimodal Agent) : กันยายน
โมเดลสร้างวิดีโอ (Video Generation) : ตุลาคม

Grok 4 ยังเปิดให้ใช้งานผ่าน API โดย xAI มุ่งหวังให้เหล่านักพัฒนาและองค์กรนำไปสร้างแอปพลิเคชันของตนเอง โดยขณะนี้ฝ่าย Enterprise ของ xAI เพิ่งเปิดตัวได้เพียง 2 เดือน และอยู่ระหว่างการทำงานร่วมกับผู้ให้บริการคลาวด์ขนาดใหญ่ (Hyperscalers)

ทั้งนี้ Grok ถูกวิจารณ์หนักจากการแสดงความเห็นเชิงต่อต้านชาวยิวบนแพลตฟอร์ม X ซึ่ง xAI ต้องลบโพสต์และจำกัดบัญชี Grok ชั่วคราว พร้อมถอดคำสั่งใน System Prompt ที่ระบุให้ AI “ไม่หลีกเลี่ยงการพูดประเด็นไม่ถูกต้องทางการเมือง”

และในวันเดียวกับการเปิดตัว Grok 4 ยังมีเหตุการณ์สำคัญคือ Linda Yaccarino ลาออกจากตำแหน่ง CEO ของ X โดยไม่มีการแต่งตั้งผู้สืบตำแหน่งในทันที

ทั้งนี้ แม้ตอนนี้ทาง xAI พยายามชูด้านความฉลาดและอิสระในการใช้งาน ผลเทสต์ทิ้งห่างคู่แข่งหลายด้าน แต่ว่าจะได้รับน่าเชื่อถือจากผู้ใช้งานหรือไม่ ก็ยังเป็นคำถามที่ต้องรอคำตอบ และยิ่งเร็ว ๆ นี้ GPT-5 จาก OpenAI กำลังจะเปิดตัว ผลทดสอบ Grok 4 จะยังเจ๋งกว่าอยู่ไหม?

แพ็กเกจบริการ AI : SuperGrok Heavy ราคาเกือบหมื่น

แพ็กเกจ SuperGrok Heavy จะมีราคา 300 ดอลลาร์/เดือน (ราว 9,700 บาท)

จะเปิดให้เข้าถึง Grok 4 Heavy แบบพรีวิว และฟีเจอร์ใหม่ ๆ ล่วงหน้า ก่อนใคร
รองรับโมเดลใหม่ที่กำลังจะเปิดตัว เช่น
- โมเดล AI ด้านการเขียนโค้ด : สิงหาคม
- Multimodal Agent : กันยายน
- โมเดลสร้างวิดีโอ (Video Generation) : ตุลาคม

ที่มา : xAI, techcrunch