أعلنت شركة أنثروبيك عن تحديثات جوهرية لمجموعة نماذجها للذكاء الاصطناعي، تشمل نسخة محسّنة من نموذج كلود 3.5 سونيت (Claude Sonnet 3.5) ونموذجاً جديداً يُدعى كلود 3.5 هايكو (Claude Haiku 3.5). يتميز الإصدار المطوّر من سونيت بتحسينات ملحوظة في قدرات البرمجة، متفوقاً على النماذج المتاحة للجمهور في العديد من المقاييس المرجعية. كما طرحت الشركة ميزة مبتكرة في نسختها التجريبية تُسمى "استخدام الحاسوب"، تتيح لنموذج كلود التفاعل مع أجهزة الكمبيوتر كما يفعل البشر - من خلال مشاهدة الشاشة وتحريك المؤشر والكتابة. وعلى الرغم من أن هذه الميزة لا تزال في مرحلتها التجريبية، إلا أنها تخضع حالياً للاختبار من قبل شركات كبرى مثل أسانا وكانفا ودور داش. أما نموذج كلود 3.5 هايكو الجديد، فيضاهي أداء النموذج السابق كلود 3 أوبوس مع الحفاظ على الفعالية من حيث التكلفة والسرعة.
أبرز النقاط:
- النسخة المحدثة من كلود 3.5 سونيت تحقق تحسينات كبيرة في البرمجة، بنسبة نجاح تصل إلى 49.0% في اختبار SWE-bench المعتمد
- إطلاق ميزة استخدام الحاسوب التي تمكّن كلود من التفاعل مع أجهزة الكمبيوتر بطريقة تحاكي السلوك البشري (حالياً في المرحلة التجريبية)
- نموذج كلود 3.5 هايكو يحقق نفس أداء كلود 3 أوبوس بتكلفة أقل وسرعة أعلى
- تم اختبار ميزة استخدام الحاسوب من قبل شركات كبرى في مهام متعددة الخطوات
- الحفاظ على نفس الأسعار وسرعة الأداء كما في النماذج السابقة
- تسجيل ميزة استخدام الحاسوب نسبة 14.9% في مقياس OSWorld، متفوقة بما يقارب الضعف على أقرب نظام ذكاء اصطناعي منافس
- خضوع النماذج لاختبارات معاهد السلامة للذكاء الاصطناعي في الولايات المتحدة والمملكة المتحدة قبل إطلاقها
- لا تزال ميزة استخدام الحاسوب تواجه بعض القيود في العمليات الأساسية مثل التمرير والسحب
- تطبيق إجراءات أمنية تشمل مصنِّفات جديدة لرصد أي إساءة محتملة لاستخدام هذه الميزة