Nous Research تطلق Hermes 4: نماذج «استدلال هجين» (hybrid reasoning) بأوزان مفتوحة (open-weight) وحواجز أمان أقل (guardrails)

Nous Research تطلق Hermes 4: نماذج «استدلال هجين» (hybrid reasoning) بأوزان مفتوحة (open-weight) وحواجز أمان أقل (guardrails)

أطلقت Nous Research Hermes 4، عائلة نماذج لغوية مفتوحة الأوزان صُمِّمت لمنح المستخدمين تحكماً أكبر وتقليل قيود المحتوى، مع الحفاظ على أداء من الفئة العليا. تقدّم النماذج وضع «الاستدلال الهجين» (hybrid reasoning) القادر على التبديل بين إجابات سريعة وتفكير أعمق خطوة بخطوة، مع إظهار الأفكار الوسيطة داخل وسوم . وعلى معايير القياس (benchmarks)، حقّق أكبر نموذج بسعة 405B نسبة 96.3% على MATH-500 و81.9% على AIME’24، وتصدّر مقياس RefusalBench الجديد لدى الشركة بنسبة 57.1% (مقابل 17.67% لـ GPT-4o و17% لـ Claude Sonnet 4)، ما يدلّ على انخفاض كبير في معدّلات الرفض للإجابة.

على المستوى التقني، جرى تدريب Hermes 4 باستخدام DataForge (محرك بيانات اصطناعية قائم على الرسوم البيانية) وAtropos، وهو إطار عمل مفتوح المصدر للتعلّم المعزَّز (RL) يوفّر العديد من «البيئات» المتخصصة (gyms). تم التدريب على 3.5 مليون عيّنة استدلال و1.6 مليون عيّنة غير استدلالية باستخدام 192 وحدة معالجة رسومية من نوع Nvidia B200 (GPU) بإجمالي 71,616 ساعة GPU. وتدرّب مرحلة ضبط الطول (length-control) النماذج على التوقّف عن الاستدلال عند 30,000 رمز (tokens)، ما يحدّ من الاسترسال غير المنضبط في التفكير بنسبة 65–79%. تتوافر النماذج كأوزان قابلة للتنزيل، وعبر واجهة Nous Chat المحسّنة (UI)، ومن خلال شركاء مثل Chutes وNebius وLuminal—وهو ما يضع Hermes 4 في صلب الجدل الدائر حول حواجز الأمان (guardrails) مقابل حرية المستخدم.

النقاط الرئيسية

  • يمكّن «الاستدلال الهجين» (hybrid reasoning) المستخدمين من التبديل بين إجابات سريعة وتفكير شفّاف ومتدرّج خطوة بخطوة عبر وسوم .
  • أبرز النتائج: 96.3% على MATH-500، و81.9% على AIME’24، ونتيجة رائدة 57.1% على RefusalBench.
  • حزمة التدريب: DataForge للبيانات الاصطناعية وAtropos للتعلّم المعزَّز (RL) و«بيئات» (gyms) متخصصة؛ 3.5 مليون عيّنة استدلال + 1.6 مليون عيّنة غير استدلالية؛ 192 وحدة B200 GPU و71,616 ساعة GPU.
  • حل ضبط الطول يضع سقفاً للتفكير عند 30 ألف رمز (tokens)، ما يقلّل الإفراط في الاستدلال بنسبة 65–79% مع الحفاظ على الدقة.
  • أوزان مفتوحة (open-weight)، وإتاحة عبر API وواجهة المستخدم (UI)، وشركاء للاستدلال (inference) تعكس نهجاً منفتحاً يقدّم تحكّم المستخدم على حساب حواجز المحتوى الصارمة (guardrails).

في جملة واحدة

Hermes 4 عائلة نماذج ذكاء اصطناعي مفتوحة الأوزان (open-weight) تركّز على الاستدلال الهجين (hybrid reasoning)، وتحقّق أداءً قوياً في الرياضيات والبرمجة مع معدّلات رفض منخفضة. ويسهم تصميمها الشفّاف وتخفيف حواجز الأمان (guardrails) في تغذية نقاش أوسع حول السلامة مقابل تحكّم المستخدم في الأنظمة المتقدمة للذكاء الاصطناعي.

المصادر: 1

\