المعيار الجديد GDPval من OpenAI يشير إلى اقتراب GPT‑5 من مستوى أداء الخبراء — مع تحفّظات كبيرة

في جملة واحدة يوحي المعيار GDPval من OpenAI بأن GPT‑5 يقترب من مستوى أداء الخبراء في بعض المهام على نمط التقارير، رغم أن الاختبار محدود وفي مراحله المبكرة. تخطط الشركة لإجراء تقييمات أوسع بينما تطرح الذكاء الاصطناعي كمساعد عملي عبر الصناعات....

Databricks تسلّط الضوء على GEPA لتحسين التوجيهات وخفض التكاليف حتى 90 مرة، وتتيح وصولاً أصيلاً إلى GPT-5

في جملة واحدة تقنية GEPA من Databricks تعد بمكاسب ملموسة عبر توجيهات أذكى، مع خفض محتمل لتكاليف تقديم نماذج الذكاء الاصطناعي (serving) والتفوق على الضبط الدقيق (fine-tuning). وتضيف الشراكة مع OpenAI وصولاً أصيلاً إلى GPT-5، ما يعزّز نهجاً متعدد...

أدوات الذكاء الاصطناعي تستشهد بأبحاث مسحوبة ولا تحذّر المستخدمين دائماً

تفيد عدة دراسات بأن روبوتات الدردشة بالذكاء الاصطناعي وأدوات البحث العلمي تعتمد أحياناً على أوراق علمية جرى سحبها، فتقدّم إجابات تبدو موثوقة لكنها مبنية على أعمال معيبة. وفي اختبارات، استشهد ChatGPT المدعوم بـ GPT-4o بأوراق مسحوبة في عدد من...

مايكروسوفت تضيف نماذج Claude من أنثروبيك (Anthropic) إلى مايكروسوفت 365 كوبيلوت (Microsoft 365 Copilot)، مما يوسّع خيارات النماذج المتاحة للشركات

تدمج مايكروسوفت نماذج Claude Sonnet 4 وClaude Opus 4.1 من أنثروبيك (Anthropic) في مايكروسوفت 365 كوبيلوت (Microsoft 365 Copilot)، بدءاً ضمن ميزة الباحث (Researcher) واستوديو كوبيلوت (Copilot Studio). سيواصل كوبيلوت (Copilot) الاعتماد على أحدث...

DeepSeek تحذّر من مخاطر كسر القيود (jailbreak) في النماذج مفتوحة المصدر (open-source)، وتعرض تفاصيل اختبارات السلامة في ورقة بحثية بمجلة Nature

حذّرت شركة الذكاء الاصطناعي (AI) الصينية الناشئة DeepSeek من أن نماذجها مفتوحة المصدر (open-source) عُرضة على نحوٍ خاص لمحاولات كسر القيود (jailbreak) من قِبل جهات خبيثة. وفي مقالة محكَّمة نُشرت في مجلة Nature، أوضحت الشركة، التي تتخذ من هانغتشو...