كوهر تكشف عن Embed 4: تعزيز البحث بالذكاء الاصطناعي بقدرات متعددة الوسائط ومعالجة المستندات الطويلة

كوهر تكشف عن Embed 4: تعزيز البحث بالذكاء الاصطناعي بقدرات متعددة الوسائط ومعالجة المستندات الطويلة

أطلقت شركة كوهر المتخصصة في الذكاء الاصطناعي (AI) نموذج Embed 4، وهو أحدث إصدار من نموذج التضمينات (Embeddings model) الخاص بها، والمصمم خصيصًا لتحسين كيفية استخدام الشركات للذكاء الاصطناعي في البحث واسترجاع المعلومات. تقوم التضمينات (Embeddings) بتحويل البيانات المعقدة مثل المستندات والصور إلى تمثيلات رقمية يمكن لأنظمة الذكاء الاصطناعي فهمها والبحث فيها بسهولة. هذه التقنية حاسمة لتقنية التوليد المعزز بالاسترجاع (Retrieval Augmented Generation - RAG)، وهي تقنية شائعة تسمح لوكلاء الذكاء الاصطناعي (AI agents) بالوصول إلى معلومات الشركة المحددة لتقديم إجابات أكثر دقة وملاءمة.

يقدم Embed 4 ترقيات مهمة، أبرزها قدرته على التعامل مع البيانات متعددة الوسائط (Multimodal data) (النصوص والصور) ومعالجة المستندات الأطول بكثير – تصل إلى حوالي 200 صفحة، بفضل نافذة السياق (Context window) الموسعة التي تبلغ 128,000 رمز (token). تؤكد كوهر على قوة النموذج في التعامل مع بيانات الأعمال الواقعية غير المنظمة، بما في ذلك المستندات الممسوحة ضوئيًا، والكتابة اليدوية، والنصوص التي تحتوي على أخطاء، دون الحاجة إلى تنظيف شامل للبيانات مسبقًا. تم تصميم Embed 4 مع مراعاة احتياجات المؤسسات والأمان، وهو يدعم أكثر من 100 لغة ويمكن نشره بشكل آمن داخل البنية التحتية الخاصة بالشركة، مما يجعله مناسبًا للصناعات المنظمة مثل التمويل والرعاية الصحية.

النقاط الرئيسية

  • دعم متعدد الوسائط والمستندات الطويلة: يفهم Embed 4 البيانات المعقدة التي تجمع بين النصوص والصور ويمكنه معالجة المستندات الطويلة (تصل إلى 200 صفحة تقريبًا أو 128 ألف رمز token).
  • موجه للمؤسسات والأمان: مصمم خصيصًا لاستخدام الشركات، لا سيما في القطاعات المنظمة، ويوفر خيارات نشر آمنة (سحابة خاصة أو في الموقع).
  • يتعامل مع البيانات غير المثالية: مصمم للعمل بفعالية مع البيانات الواقعية غير المنظمة مثل المستندات الممسوحة ضوئيًا والكتابة اليدوية وأخطاء النصوص، مما يقلل الحاجة إلى المعالجة المسبقة للبيانات (Data pre-processing).
  • يحسن RAG ووكلاء الذكاء الاصطناعي: يُنشئ تضمينات (embeddings) فعالة لتعزيز دقة وقدرات أنظمة البحث المدعومة بالذكاء الاصطناعي والمساعدين الافتراضيين داخل المؤسسات.
  • التكلفة والكفاءة: يُنشئ تضمينات مضغوطة (Compressed embeddings) لخفض تكاليف تخزين البيانات ويعمل بكفاءة لتلبية متطلبات المؤسسات واسعة النطاق.

في جملة واحدة

يساعد نموذج Embed 4 الجديد من كوهر الشركات على تحسين البحث باستخدام الذكاء الاصطناعي (AI) من خلال فهم النصوص والصور في المستندات الطويلة جدًا والتعامل بفعالية مع البيانات الواقعية غير المنظمة لتحسين أداء تقنية RAG ووكلاء الذكاء الاصطناعي (AI agents).

المصادر: 1

\