تطرح OpenAI gpt-realtime لدفع تبنّي الذكاء الاصطناعي الصوتي على مستوى المؤسسات

أطلقت OpenAI gpt-realtime، وهو نموذج ذكاء اصطناعي لتحويل الكلام إلى كلام (speech-to-speech) صُمّم للالتزام الدقيق بالتعليمات والتحدّث بأصوات أكثر طبيعية وتعبيراً. يتوفر النموذج عبر واجهة برمجة تطبيقات الوقت الحقيقي (Realtime API) التي باتت الآن...

مايكروسوفت تُقدّم أول نماذج الذكاء الاصطناعي المطوَّرة داخلياً: MAI-Voice-1 وMAI-1-preview

قدّمت مايكروسوفت، عبر قسم Microsoft AI، أول نماذجها المطوَّرة داخلياً: MAI-Voice-1 وMAI-1-preview. MAI-Voice-1 نموذج صوتي قادر على توليد دقيقة كاملة من الكلام في أقل من ثانية واحدة باستخدام وحدة معالجة رسومات واحدة (GPU). وهو يزوّد بالفعل ميزات...

Google Translate يضيف دروساً لغوية مدعومة بالذكاء الاصطناعي (AI) ووضع محادثة مباشر

تطرح Google تمارين لغوية مدعومة بالذكاء الاصطناعي داخل تطبيق Google Translate، ما يجعله منافساً مباشراً لـ Duolingo. تتيح الميزة التجريبية الجديدة (بيتا) إنشاء تمارين الاستماع والمحادثة المفصّلة التي تتكيّف مع مستواك وأهدافك، وتتابع تقدّمك...

OpenCUA: إطار عمل مفتوح المصدر لوكلاء استخدام الحاسوب يتحدى الحلول المملوكة الرائدة (Proprietary)

أطلق باحثون من جامعة هونغ كونغ وشركاؤهم OpenCUA، وهو إطار عمل مفتوح المصدر لبناء وكلاء استخدام الحاسوب (Computer-Use Agents) القادرين على تشغيل البرمجيات والمواقع كما يفعل البشر. ومن خلال الجمع بين الأدوات والبيانات وبروتوكولات التدريب، يمكّن...

MCP‑Universe من Salesforce يبيّن أن GPT‑5 ونظراءه يواجهون صعوبات في تنسيق العمليات في العالم الواقعي

أطلقت Salesforce AI Research MCP‑Universe، وهو معيار مفتوح المصدر يقيس أداء النماذج اللغوية الكبيرة (LLMs) في مهام عملية عبر بروتوكول سياق النموذج (MCP). وعلى خلاف الاختبارات التقليدية التي تعزل مهارات كالحساب أو استدعاء الدوال، يقيس MCP‑Universe...