OpenAI تختبر نظام توجيه للسلامة في ChatGPT وتطرح ضوابط أبوية وسط تصاعد المخاوف

في جملة واحدة تختبر OpenAI نظام توجيه للسلامة (Safety Routing) للمحادثات الحساسة وتطرح ضوابط أبوية (Parental Controls) لمستخدمي فئة المراهقين. تهدف التحديثات إلى تحقيق توازن بين السلامة والخصوصية والفائدة، فيما ينقسم المستخدمون حول مستوى التحفّظ...

Anthropic تكشف عن Claude Sonnet 4.5 وتروّج لتشغيل ذاتي حتى 30 ساعة وترقيات للوكلاء (agents)

في جملة واحدة Claude Sonnet 4.5 من Anthropic يستهدف البرمجة بمستوى الإنتاج وسير عمل قائمًا على الوكلاء طويلة الأمد، ويعمل بصورة مستقلة لمدة تصل إلى 30 ساعة مع أدوات جديدة للوكلاء. يركّز الإصدار على مكاسب عملية في القدرات وتحسينات في السلامة وسط...

المعيار الجديد GDPval من OpenAI يشير إلى اقتراب GPT‑5 من مستوى أداء الخبراء — مع تحفّظات كبيرة

في جملة واحدة يوحي المعيار GDPval من OpenAI بأن GPT‑5 يقترب من مستوى أداء الخبراء في بعض المهام على نمط التقارير، رغم أن الاختبار محدود وفي مراحله المبكرة. تخطط الشركة لإجراء تقييمات أوسع بينما تطرح الذكاء الاصطناعي كمساعد عملي عبر الصناعات....

Databricks تسلّط الضوء على GEPA لتحسين التوجيهات وخفض التكاليف حتى 90 مرة، وتتيح وصولاً أصيلاً إلى GPT-5

في جملة واحدة تقنية GEPA من Databricks تعد بمكاسب ملموسة عبر توجيهات أذكى، مع خفض محتمل لتكاليف تقديم نماذج الذكاء الاصطناعي (serving) والتفوق على الضبط الدقيق (fine-tuning). وتضيف الشراكة مع OpenAI وصولاً أصيلاً إلى GPT-5، ما يعزّز نهجاً متعدد...

أدوات الذكاء الاصطناعي تستشهد بأبحاث مسحوبة ولا تحذّر المستخدمين دائماً

تفيد عدة دراسات بأن روبوتات الدردشة بالذكاء الاصطناعي وأدوات البحث العلمي تعتمد أحياناً على أوراق علمية جرى سحبها، فتقدّم إجابات تبدو موثوقة لكنها مبنية على أعمال معيبة. وفي اختبارات، استشهد ChatGPT المدعوم بـ GPT-4o بأوراق مسحوبة في عدد من...