نموذج «جيميني» للتضمين يتصدّر المركز الأول، لكن المنافسين مفتوحو المصدر يقتربون

نموذج «جيميني» للتضمين يتصدّر المركز الأول، لكن المنافسين مفتوحو المصدر يقتربون

أتاحت Google نموذج التضمين «جيميني» (Gemini Embedding Model)‏ (gemini-embedding-001) للاستخدام العام عبر Gemini API وVertex AI، ليتصدّر فوراً المركز الأول في معيار التضمين النصي الشامل Massive Text Embedding Benchmark (MTEB). يحوّل النموذج النصوص إلى متجهات رقمية تُستخدم في مهام مثل البحث الدلالي، والتوليد المعزَّز بالاسترجاع (Retrieval-Augmented Generation)، والتصنيف، والتجميع. وبفضل تقنية «تعلّم التمثيل ماتريوشكا» (Matryoshka Representation Learning) يستطيع المطوّرون اختيار أبعاد متجه تبلغ ‎3,072‎ أو ‎1,536‎ أو ‎768‎ بعداً، لتحقيق توازن بين الدقّة وتكاليف التخزين وزمن التنفيذ. يدعم جيميني أكثر من 100 لغة، ويُسعَّر بـ ‎$0.15‎ لكل مليون رمز (token)، ما يجعله خياراً جذاباً ومتكاملاً للفرق التي تعتمد أساساً على Google Cloud.

مع ذلك، فإن هذا التفوّق طفيف؛ إذ يتخلّف نموذج التضمين مفتوح المصدر «Qwen3-Embedding» من Alibaba بفارق ضئيل جداً في MTEB، مع توفيره رخصة أباتشي ‎2.0‎ وإمكانية الاستضافة الذاتية. ويلاحقهما عن قرب منافسون مغلقون آخرون مثل OpenAI وCohere وMistral المتخصص في الشيفرة. بالنسبة للمؤسسات، يتمحور القرار اليوم بين سهولة التكامل مع بيئة Google المغلقة، وبين المرونة والتحكّم في التكلفة وسيادة البيانات التي تعد بها البدائل مفتوحة المصدر سريعة التطوّر. ويُبرز هذا السباق المحتدم السرعة التي يتغيّر بها مشهد نماذج التضمين.

النقاط الرئيسية

  • أصبح نموذج Gemini للتضمين متاحاً للاستخدام العام ويتصدّر حالياً لوحة ترتيب MTEB.
  • يعتمد على تقنية «تعلّم التمثيل ماتريوشكا» لتقديم ثلاثة أحجام من المتجهات توازن بين الدقّة والتكلفة.
  • يقدّم نموذج Qwen3-Embedding مفتوح المصدر من Alibaba أداءً شبه مماثل مع إمكانية الاستضافة الذاتية بموجب رخصة أباتشي ‎2.0‎.
  • تظل نماذج OpenAI وCohere وMistral منافسين مغلقين أقوياء، لا سيما في البيانات المؤسسية الضخمة وتطبيقات الشيفرة.
  • على المؤسسات الموازنة بين تكامل Google Cloud السلس وبين الحرية والتحكّم التي توفّرها النماذج مفتوحة المصدر.

في جملة واحدة

يتصدّر نموذج Gemini للتضمين من Google معيار MTEB حالياً، لكن المنافسين مفتوحو المصدر والمغلقون—وفي مقدمتهم Qwen3-Embedding من Alibaba—يقفون على مقربة، ما يوفّر للمؤسسات خيارات قويّة ومتعدّدة لبناء حلول البحث الدلالي والتوليد المعزَّز بالاسترجاع.

المصادر: 1

\