أعلنت شركة xAI المملوكة لإيلون ماسك عن إطلاق Grok-4، وهو نظام ذكاء اصطناعي جديد يصفه ماسك بأنه «أذكى نظام في العالم». في اختبارات الشركة الداخلية، أحرز النموذج 44.4٪ في «اختبار البشرية الأخير» (Humanity’s Last Exam – HLE) عند تشغيله في وضعه متعدّد الوكلاء «Grok-4 Heavy»، متفوّقًا بفارق كبير على نموذجي «Gemini-Pro» من غوغل و«o3» من OpenAI على المعيار نفسه. كما استعرضت xAI قدرة Grok-4 على توليد تصورات لثقوب سوداء، والغناء عبر ميزة الصوت الجديدة، واحتساب احتمالات مباريات البيسبول في الوقت الفعلي. يبلغ سعر الإصدار القياسي 30 دولارًا شهريًا، بينما يصل اشتراك فئة «Heavy» الأعلى أداءً إلى 300 دولار.
وتضع المنصة المستقلة «Artificial Analysis» حاليًا Grok-4 في صدارة مؤشرها للذكاء، كما يتصدّر النموذج قائمتَي الترتيب الخاصة بمجموعة التجريد والاستدلال (Abstraction and Reasoning Corpus – ARC). ويشيد المستخدمون الأوائل بقدراته في الرياضيات والبرمجة، إلا أنهم يلاحظون صِغر نافذة السياق وأداءً متعدد الوسائط ما زال غير مستقر. وينبّه المنتقدون إلى أنّ xAI لم تقدّم بعد نتائج HLE إلى لوحة الترتيب العامة، وأنّ Grok-4 يكرّر أحيانًا آراء ماسك الشخصية على وسائل التواصل الاجتماعي في قضايا خلافية. يأتي هذا الإصدار عقب جدل حول مخرجات متحيّزة في Grok-3، ما دفع xAI إلى إضافة ضمانات جديدة بينما يتأمّل ماسك المخاطر—والإثارة—المترتبة على ابتكار ذكاء يفوق البشر.
النقاط الرئيسية
- حقق Grok-4 أعلى النتائج في عدة معايير أكاديمية واستدلالية، من بينها نسبة 44.4٪ داخليًا في «اختبار البشرية الأخير» (HLE).
- يدعم النموذج إخراج الصوت وتوليد الصور قريبًا، إضافة إلى حل المشكلات بطريقة متعدّدة الوكلاء؛ ويبلغ رسم نسخة «Heavy» الممتازة 300 دولار شهريًا.
- تضع قوائم «Artificial Analysis» وARC حاليًا Grok-4 فوق «Gemini 2.5 Pro» من غوغل و«o4-mini-high» من OpenAI.
- يشيد المراقبون بقدراته في الرياضيات والبرمجة، لكنهم يلفتون إلى ضيق نافذة السياق وإلى أداء متعدد الوسائط لم يُختبر بعد على نطاق واسع.
- ما تزال هناك تساؤلات حول التحيّز، والتحقق العلني من النتائج، وسلامة أنظمة الذكاء الاصطناعي سريعة التطور.
في جملة واحدة
يصل Grok-4 من xAI إلى السوق بأرقام لافتة في الاختبارات وميزات إبداعية، فيما يطالب منتقدون بتدقيق مستقل وضمانات أقوى. ويجسد الظهور الأول للنموذج مزيجًا من الوعود وعدم اليقين وسط سباق الذكاء الاصطناعي المتسارع.
المصادر: 1