مونشوت للذكاء الاصطناعي تطرح «كيمي K2»: نموذج مفتوح المصدر يتفوّق على GPT-4 في مهام البرمجة

مونشوت للذكاء الاصطناعي تطرح «كيمي K2»: نموذج مفتوح المصدر يتفوّق على GPT-4 في مهام البرمجة

أعلنت شركة Moonshot AI الصينية الناشئة عن إتاحة نموذجها «كيمي K2» كبرنامج مفتوح المصدر. يعتمد النموذج على بنية «مزيج الخبراء» (Mixture-of-Experts) ويحتوي على تريليون معلمة، وقد صُمِّم خصيصاً للعمل «الوكيلي» المستقل، مثل كتابة الشيفرة وتنفيذها، واستخدام الأدوات الخارجية، وإنجاز المهام متعددة الخطوات بلا تدخل بشري. وفي الاختبارات القياسية المنشورة، تفوّق الإصدار المضبوط بالتعليمات على النماذج المغلقة مثل GPT-4 وAnthropic Claude أو عادلها: 53.7٪ في LiveCodeBench للبرمجة و97.4٪ في MATH-500 للرياضيات، كما تصدّر قائمة النماذج مفتوحة المصدر بدقة 65.8٪ على SWE-Bench Verified.

وعلاوة على الأرقام الرئيسة، تتحدّى Moonshot اقتصاديات عمالقة التكنولوجيا؛ إذ لا تتجاوز تكلفة واجهة برمجة تطبيقات «كيمي K2» 0.15 دولار لكل مليون رمز إدخال و2.50 دولار لكل مليون رمز إخراج، فيما يتوافر الكود المصدري مجاناً لأي جهة ترغب في مراجعته أو تكييفه أو استضافته ذاتياً. وتشير الشركة إلى أن مُحسِّناً جديداً يحمل اسم MuonClip حافظ على استقرار تدريب النموذج ذي التريليون معلمة، ما يمهّد لسبل تطوير أسرع وأقلّ كلفة للنماذج الضخمة مستقبلاً. وتُظهر العروض التوضيحية المبكرة بالفعل قدرة «كيمي K2» على تخطيط الرحلات وتحليل بيانات الرواتب من البداية إلى النهاية، في دلالة على انتقال وشيك من روبوتات الدردشة إلى زملاء عمل رقميين حقيقيين.

النقاط الرئيسية

  • يعتمد «كيمي K2» بنية «مزيج الخبراء» بتريليون معلمة، مع 32 مليار معلمة فعّالة لكل طلب.
  • يتفوّق على GPT-4.1 وDeepSeek-V3 في LiveCodeBench ويُحقق 97.4٪ على MATH-500.
  • يتوافر النموذج برخصة مفتوحة المصدر إلى جانب واجهة برمجة تطبيقات منخفضة التكلفة (0.15 / 2.50 دولار لكل مليون رمز).
  • يزعم مُحسّن MuonClip أنه يقضي على عدم استقرار التدريب في النماذج العملاقة، ما يقلل الهدر الحاسوبي.
  • تكشف العروض «الوكيلية» المبكرة عن قدرة «كيمي K2» على تفكيك المهام ذاتياً، واختيار الأدوات، والتعافي من الأخطاء.

في جملة واحدة

يشكّل «كيمي K2» من Moonshot AI نموذج لغة ضخماً مجانياً ومفتوح المصدر يتفوّق أو يعادل GPT-4 في البرمجة والرياضيات ومعايير الأداء الوكيلي، فيما يأتي استخدامه بتكلفة أقلّ بكثير. يمثّل الإطلاق محطة مفصلية للذكاء الاصطناعي المفتوح المصدر ويزيد الضغط على المورّدين المملوكين من حيث الأداء والسعر.

المصادر: 1

\