المعيار الجديد GDPval من OpenAI يشير إلى اقتراب GPT‑5 من مستوى أداء الخبراء — مع تحفّظات كبيرة

في جملة واحدة يوحي المعيار GDPval من OpenAI بأن GPT‑5 يقترب من مستوى أداء الخبراء في بعض المهام على نمط التقارير، رغم أن الاختبار محدود وفي مراحله المبكرة. تخطط الشركة لإجراء تقييمات أوسع بينما تطرح الذكاء الاصطناعي كمساعد عملي عبر الصناعات....

Databricks تسلّط الضوء على GEPA لتحسين التوجيهات وخفض التكاليف حتى 90 مرة، وتتيح وصولاً أصيلاً إلى GPT-5

في جملة واحدة تقنية GEPA من Databricks تعد بمكاسب ملموسة عبر توجيهات أذكى، مع خفض محتمل لتكاليف تقديم نماذج الذكاء الاصطناعي (serving) والتفوق على الضبط الدقيق (fine-tuning). وتضيف الشراكة مع OpenAI وصولاً أصيلاً إلى GPT-5، ما يعزّز نهجاً متعدد...

أدوات الذكاء الاصطناعي تستشهد بأبحاث مسحوبة ولا تحذّر المستخدمين دائماً

تفيد عدة دراسات بأن روبوتات الدردشة بالذكاء الاصطناعي وأدوات البحث العلمي تعتمد أحياناً على أوراق علمية جرى سحبها، فتقدّم إجابات تبدو موثوقة لكنها مبنية على أعمال معيبة. وفي اختبارات، استشهد ChatGPT المدعوم بـ GPT-4o بأوراق مسحوبة في عدد من...

DeepSeek تحذّر من مخاطر كسر القيود (jailbreak) في النماذج مفتوحة المصدر (open-source)، وتعرض تفاصيل اختبارات السلامة في ورقة بحثية بمجلة Nature

حذّرت شركة الذكاء الاصطناعي (AI) الصينية الناشئة DeepSeek من أن نماذجها مفتوحة المصدر (open-source) عُرضة على نحوٍ خاص لمحاولات كسر القيود (jailbreak) من قِبل جهات خبيثة. وفي مقالة محكَّمة نُشرت في مجلة Nature، أوضحت الشركة، التي تتخذ من هانغتشو...

مهندسو DeepSeek يشرحون بالتفصيل كيف اكتسب نموذجهم R1 قدرة الاستدلال

شارك مهندسو DeepSeek-R1، وهو نموذج ذكاء اصطناعي مفتوح المصدر انتشر على نطاق واسع من شركة DeepSeek الناشئة مقرّها هانغتشو، تفاصيل تدريب النظام على معالجة مهام الاستدلال المعقّدة. في ورقة بحثية محكّمة نُشرت الأربعاء في مجلة Nature، يوضح الفريق أنه...