
في جملة واحدة
Kimi K2 Thinking من Moonshot AI يمثل قائداً جديداً مفتوح المصدر، متفوقاً على GPT-5 وClaude Sonnet 4.5 في معايير الاستدلال والبرمجة. مع ترخيص مرن، وكفاءة قوية، واستدلال شفاف، يرفع سقف قدرات نماذج المصدر المفتوح ويزيد الضغط على العروض الاحتكارية للذكاء الاصطناعي.
التفاصيل
أطلقت شركة Moonshot AI الصينية نموذج Kimi K2 Thinking المفتوح المصدر، والذي يتفوق على الأنظمة الاحتكارية الرائدة مثل GPT-5 من OpenAI وClaude Sonnet 4.5 من Anthropic عبر عدة معايير مرجعية واسعة الاستخدام (benchmarks). يعتمد النموذج على بنية مزيج الخبراء (Mixture-of-Experts - MoE) بسعة تقارب تريليون معامل، مع 32 مليار معامل نشط في كل خطوة استدلال، ويسجل نتائج لافتة في الاستدلال والبرمجة، منها 60.2% على BrowseComp، و44.9% على Humanity’s Last Exam، و71.3% على SWE-Bench Verified، و83.1% على LiveCodeBench v6. كما يتفوق بفارق طفيف على GPT-5 في GPQA Diamond (85.7% مقابل 84.5%) ويضاهيه في أحدث اختبارات الرياضيات، مع دعم سلاسل أدوات طويلة تضم 200–300 خطوة، وسياق بطول 256 ألف توكن، وتتبع استدلال شفاف.
K2 Thinking مطروح بموجب ترخيص MIT معدّل (Modified MIT License) يتيح الاستخدام التجاري الكامل، مع شرط إسناد بسيط فقط إذا كان المنتج يخدم أكثر من 100 مليون مستخدم نشط شهرياً أو يحقق أكثر من 20 مليون دولار شهرياً. توفر Moonshot الوصول إليه عبر platform.moonshot.ai وkimi.com وHugging Face، بما في ذلك واجهات برمجة التطبيقات (APIs) للمحادثة والاستدلال وتدفقات العمل متعددة الأدوات، مع تسعير معلن يتراوح بين 0.15 و0.60 دولار لكل مليون توكن إدخال بحسب حالة ذاكرة التخزين المؤقت (إصابة/عدم إصابة)، و2.50 دولار لكل مليون توكن إخراج. يتجاوز هذا الإطلاق أحدث النماذج مفتوحة الأوزان مثل MiniMax-M2، ويكثّف الضغط على مزوّدي الذكاء الاصطناعي المغلق في وقت تخضع فيه خطط الإنفاق الضخمة للصناعة للتدقيق.
النقاط الرئيسية
- يتفوّق K2 Thinking على GPT-5 وClaude Sonnet 4.5 عبر معايير متعددة (على سبيل المثال: BrowseComp 60.2% مقابل 54.9% لـGPT-5)، ويسجل درجات قوية في البرمجة والاسترجاع.
- مطروح بموجب ترخيص MIT معدّل: مجاني للاستخدام التجاري، مع إسناد ظاهر في واجهة المستخدم فقط عند تجاوز 100 مليون مستخدم نشط شهرياً أو 20 مليون دولار من الإيرادات شهرياً.
- أبرز الجوانب التقنية: نموذج مزيج الخبراء بسعة تريليون معامل مع 32 مليار معامل نشط لكل استدلال، حتى 200–300 استدعاء متسلسل للأدوات، سياق بطول 256 ألف توكن، وتتبع استدلال شفاف.
- تكاليف منافسة: 0.15–0.60 دولار لكل مليون توكن إدخال و2.50 دولار لكل مليون توكن إخراج، مع أوزان مفتوحة وواجهات برمجة تطبيقات (APIs) متاحة على منصات Moonshot وHugging Face.
- يتخطى MiniMax-M2 ويقلّص الفجوة مع أفضل النماذج المغلقة، ما يشير إلى أن أنظمة الأوزان المفتوحة باتت قادرة على مجاراة أو تجاوز الاستدلال على مستوى النماذج المتقدمة جداً (frontier-level).
المصادر: 1