جوجل تُطلق "التخزين المؤقت الضمني" لخفض تكاليف نماذج الذكاء الاصطناعي

جوجل تُطلق "التخزين المؤقت الضمني" لخفض تكاليف نماذج الذكاء الاصطناعي

أعلنت جوجل عن إطلاق ميزة جديدة تحت اسم "التخزين المؤقت الضمني" (Implicit Caching) ضمن واجهة برمجة التطبيقات Gemini API، وذلك بهدف مساعدة المطورين على تقليل النفقات المرتبطة باستخدام أحدث نماذج الذكاء الاصطناعي التابعة لها. صُممت هذه الميزة لتحقيق وفورات ملحوظة، قد تصل إلى 75%، في تكلفة معالجة "السياقات المتكررة" (Repetitive Context) التي تُمرر إلى نموذجي Gemini 2.5 Pro و Gemini 2.5 Flash عبر واجهة برمجة التطبيقات (API). ومن المتوقع أن يلقى هذا التوجه استحسانًا كبيرًا من قبل المطورين الذين يتزايد قلقهم بشأن التكاليف الباهظة المرتبطة بتوظيف نماذج الذكاء الاصطناعي المتطورة.

بخلاف آلية التخزين المؤقت الصريح (Explicit Caching) السابقة من جوجل، والتي كانت تتطلب من المطورين تحديد التعليمات البرمجية المستخدمة بشكل متكرر يدويًا، يعمل التخزين المؤقت الضمني (Implicit Caching) بصورة تلقائية ويُفعل افتراضيًا لنموذجي Gemini 2.5. فعندما يتشارك طلب مُرسل إلى أحد نموذجي Gemini 2.5 بادئة مشتركة مع طلبات سابقة، فإنه يصبح مؤهلاً للاستفادة من "ذاكرة التخزين المؤقت" (Cache Hit)، وبالتالي تُطبق وفورات التكلفة بصورة آلية. ولتحقيق أقصى قدر من الاستفادة، تنصح جوجل المطورين بالإبقاء على السياق المتكرر في بداية الطلبات وإضافة أي سياق متغير في نهايتها. يبلغ الحد الأدنى لعدد رموز المطالبة اللازمة لتفعيل التخزين المؤقت الضمني (Implicit Caching) 1024 رمزًا لنموذج 2.5 Flash و 2048 رمزًا لنموذج 2.5 Pro.

النقاط الرئيسية

  • يهدف "التخزين المؤقت الضمني" (Implicit Caching) من جوجل إلى خفض تكاليف نماذج الذكاء الاصطناعي على المطورين.
  • بإمكان هذه الميزة توفير ما يصل إلى 75% من تكلفة معالجة السياقات المتكررة المستخدمة في طلبات Gemini API.
  • يعمل التخزين المؤقت الضمني (Implicit Caching) بصورة تلقائية، على عكس آلية التخزين المؤقت الصريح (Explicit Caching) اليدوية السابقة.
  • تُفعل الميزة افتراضيًا لنموذجي Gemini 2.5 Pro و Gemini 2.5 Flash.
  • يُنصح المطورون بالإبقاء على السياق المتكرر في بداية الطلبات لتعظيم الوفورات.

في جملة واحدة

تعمل ميزة "التخزين المؤقت الضمني" (Implicit Caching) الجديدة من جوجل، والمتاحة ضمن واجهة برمجة التطبيقات Gemini API، على تقليل التكاليف تلقائيًا للمطورين من خلال تخزين التعليمات البرمجية المتكررة مؤقتًا. يساهم هذا التحديث في تبسيط عملية توفير التكاليف مقارنة بآلية التخزين المؤقت الصريح (Explicit Caching) السابقة، ويمكن أن يؤدي إلى تخفيضات كبيرة في نفقات نماذج الذكاء الاصطناعي.

المصادر: 1

\