نهج جديد من Google تحت مسمى 'السياق الكافي' لمعالجة قيود أنظمة الاسترجاع المدعومة بالذكاء الاصطناعي

نهج جديد من Google تحت مسمى 'السياق الكافي' لمعالجة قيود أنظمة الاسترجاع المدعومة بالذكاء الاصطناعي

قدّم باحثو Google مفهومًا مبتكرًا يُدعى 'السياق الكافي' (Sufficient Context)، بهدف تعزيز موثوقية ودقة أنظمة الاسترجاع المعزز بالتوليد (Retrieval-Augmented Generation - RAG) ضمن نماذج اللغة الكبيرة (Large Language Models - LLMs). تعتمد أنظمة RAG، التي تُعد حيوية في تطبيقات الذكاء الاصطناعي للاستخدامات المؤسسية، على دمج المعلومات المسترجعة خارجيًا مع المعرفة الداخلية للنموذج للإجابة على استفسارات المستخدمين. ومع ذلك، تعاني هذه الأنظمة أحيانًا من مشاكل مثل الهلوسة (Hallucinations) التي تؤدي إلى إنتاج أجوبة غير دقيقة، أو تقديم معلومات غير ذات صلة، أو العجز عن استخراج إجابات دقيقة من النصوص الطويلة. يعمل إطار 'السياق الكافي' على معالجة هذه التحديات من خلال مساعدة النماذج في تقييم ما إذا كان السياق المقدم يحتوي على معلومات كافية للإجابة بشكل دقيق ومفصل.

تتناول الدراسة تعريف السياقات ضمن فئتين رئيسيتين: الفئة الأولى هي 'كافية' عندما يحتوي السياق على جميع المعلومات المطلوبة لتوفير إجابة وافية، والفئة الثانية هي 'غير كافية' عندما تكون المعلومات ناقصة، أو متناقضة، أو غير واضحة بشكل كافٍ. لتسهيل هذا التمييز، طور فريق البحث أداة تصنيف متقدمة تعتمد على نموذج لغة كبير (LLM-based autorater) تقوم تلقائيًا بتحديد ما إذا كانت السياقات المقدمة كافية أم لا. بفضل هذه الأداة، اقترح الباحثون إطارًا يُعرف باسم 'التوليد الانتقائي' (Selective Generation) والذي يهدف إلى تقليل الهلوسة وتحسين معدل دقة إجابات أنظمة RAG بشكل عام. يتمتع هذا الابتكار بأهمية خاصة في التطبيقات المؤسسية، مثل أنظمة الذكاء الاصطناعي لخدمة العملاء، حيث يمكن لاتخاذ قرارات مدروسة حول تقديم الإجابة بثقة أو الامتناع عنها أن يُحسن بشكل كبير من موثوقية النظام. كما تؤكد النتائج على أهمية تقييم جودة النموذج الأساسي وظروف السياق المسترجع لتحسين الأداء العام.

النقاط الرئيسية

  • طوّر باحثو Google مفهوم 'السياق الكافي' (Sufficient Context) بهدف تعزيز موثوقية ودقة أنظمة الاسترجاع المعزز بالتوليد (RAG) ضمن نماذج الذكاء الاصطناعي.
  • يُصنّف إطار العمل الجديد السياق إلى 'كافي' أو 'غير كافٍ' لتوفير إجابات دقيقة وموثوقة للاستفسارات.
  • تم تطوير أداة تصنيف تعتمد على نموذج لغة كبير (LLM-based autorater) تُمكّن من تقييم كفاية السياق بشكل تلقائي ودقيق.
  • اقترح الباحثون استخدام إطار 'التوليد الانتقائي' (Selective Generation) الذي يدمج أداة التصنيف مع النماذج اللغوية الكبيرة لتقليل احتمالات الهلوسة وتقديم إجابات مدروسة أو الامتناع عند الحاجة.
  • يعد هذا التوجه الجديد ذا فوائد تطبيقية هامة للتطبيقات المؤسسية، مثل أنظمة الذكاء الاصطناعي لخدمة العملاء، حيث تُعد الموثوقية وجودة الاستجابات عوامل أساسية لنجاح هذه الأنظمة.

في جملة واحدة

قدّم باحثو Google دراسة متقدمة تُعرّف مفهوم 'السياق الكافي' (Sufficient Context) كوسيلة لتعزيز أداء أنظمة الاسترجاع المعزز بالتوليد (RAG) داخل نماذج الذكاء الاصطناعي. يركز هذا النهج على تحسين تصنيف السياق وتنفيذ إطار التوليد الانتقائي لتحقيق موثوقية ودقة أكبر للتطبيقات المؤسسية.

المصادر: 1

\