نموذج عالم الشفرة (Code World Model - CWM) من ميتا يعلّم الذكاء الاصطناعي فهم ما تفعله الشفرة، لا مجرد شكلها

نموذج عالم الشفرة (Code World Model - CWM) من ميتا يعلّم الذكاء الاصطناعي فهم ما تفعله الشفرة، لا مجرد شكلها

في جملة واحدة

يرتكز CWM في توليد الشفرة على فهم كيفية عمل البرامج فعلياً، ما يعزّز الاستدلال والموثوقية. وتلمّح النتائج القوية على الاختبارات المعيارية إلى أن نمذجة العالم قد تكون مفتاحاً لوكلاء ترميز أكثر قدرة.

التفاصيل

قدّمت ميتا نموذج عالم الشفرة (Code World Model - CWM)، وهو نموذج لغوي كبير (LLM) للبرمجة يضم 32 مليار مُعامِل، مُدرَّب على تعلُّم كيفية تصرّف البرامج عند تشغيلها، لا على مجرد توقّع الرمز التالي (next-token prediction). بدلاً من الاعتماد حصراً على نص الشفرة، يحلّل CWM مسارات التنفيذ (execution traces) في بايثون—أي كيف تتغيّر المتغيّرات وحالة البرنامج سطراً بسطر—إلى جانب تفاعلات وكيلية (agentic) متعددة الخطوات وعلى نطاق واسع ضمن حاويات Docker عبر وكيل اصطناعي يُدعى ForagerAgent. ومن خلال تعريض النموذج لهذه الديناميكيات في منتصف مرحلة التدريب (mid-training)، يبني CWM نموذجاً داخلياً للعالم (world model) يصف سلوك البرمجيات، ما يمكّنه من كتابة الشفرة واختبارها والتحقّق منها بأسلوب أقرب إلى أسلوب مطوّر بشري.

النتائج الأولية قوية: حقّق CWM معدل نجاح 65.8% على SWE-bench Verified، وأظهر أداءً جيداً على LiveCodeBench وMath-500 وAIME 2024 وCruxEval. ورغم طرحه كنموذج بحثي بموجب رخصة غير تجارية (noncommercial license)—وليس كمساعد للأغراض العامة—يشير CWM إلى مسار واعد يتجاوز التنبؤ البحت بالرمز التالي. يبرز عمل ميتا كيف أن ربط النماذج بالتنفيذ والتفاعل مع البيئة يمكن أن يحسّن الاستدلال وتنقيح الأخطاء (debugging) والبرمجة الوكيلية (agentic coding).

النقاط الرئيسية

  • يتعلّم CWM دلالات الشفرة عبر التدريب على مسارات التنفيذ (execution traces)، لا على نص المصدر وحده.
  • تساعد نمذجة العالم في منتصف مرحلة التدريب (mid-training) النموذج على الاستدلال على سلوك البرامج واختبارها.
  • تُمكّن التفاعلات الوكيلية داخل Docker (عبر ForagerAgent) من تعلّم مهام برمجية متعددة الخطوات وعلى نطاق واسع.
  • النموذج ذو 32 مليار مُعامِل يحقّق 65.8% على SWE-bench Verified ويؤدي أداءً جيداً على اختبارات معيارية أخرى في الترميز والرياضيات.
  • أُطلق لأغراض البحث بموجب رخصة غير تجارية؛ وليس مُصمَّماً كمساعد دردشة للأغراض العامة (chatbot).

المصادر: 1

\