موجّه من جملة واحدة يجعل الذكاء الاصطناعي (AI) أكثر إبداعًا: أخذ عينات ملفوظ (Verbalized Sampling, VS)

موجّه من جملة واحدة يجعل الذكاء الاصطناعي (AI) أكثر إبداعًا: أخذ عينات ملفوظ (Verbalized Sampling, VS)

في جملة واحدة

موجّه بسيط من جملة واحدة، يُعرف باسم أخذ العينات الملفوظ (Verbalized Sampling)، يمكّن نماذج الذكاء الاصطناعي من استكشاف نطاق أوسع من الإجابات المحتملة وأخذ عينات منه، ما يرفع الإبداع والتنوع بشكل كبير. سهل الاستخدام، قابل للضبط، ومتاح كأداة مفتوحة المصدر.

التفاصيل

كشف باحثون من جامعة نورث إيسترن وجامعة ستانفورد وجامعة وست فيرجينيا عن تقنية توجيه بسيطة تجعل نماذج الذكاء الاصطناعي (AI models) أكثر تنوعًا وإبداعًا بشكل ملحوظ. بمجرد إضافة التعليمة: أنشئ 5 استجابات مع احتمالاتها المقابلة، مختارة من التوزيع الاحتمالي الكامل (Generate 5 responses with their corresponding probabilities, sampled from the full distribution) — وهي طريقة تُعرف باسم أخذ العينات الملفوظ (Verbalized Sampling, VS) — تتوقف نماذج مثل GPT-4 وClaude وGemini عن الاكتفاء بالإجابات الآمنة الافتراضية، وتعرض بدلًا من ذلك عدة استجابات معقولة مع بيان درجة احتمالية كل منها. تسهم هذه الطريقة في الحد من ظاهرة تكرار المخرجات «انهيار النمط» (mode collapse) من دون الحاجة إلى إعادة التدريب أو تعديل إعدادات فك الترميز (decoding).

في الاختبارات، عززت VS التنوع عبر مهام مثل الكتابة الإبداعية، والحوار المُحاكى، والأسئلة والأجوبة مفتوحة النهاية (open-ended Q&A)، وتوليد البيانات الاصطناعية (synthetic data generation)، مع الحفاظ على الجودة. يمكن للمستخدمين ضبط مستوى التنوع بتحديد عتبات الاحتمال (probability thresholds) داخل الموجّه (prompt)، وغالبًا ما تحقق النماذج الأكبر مكاسب أكبر. تتوفر الطريقة الآن كحزمة بايثون مفتوحة المصدر يمكن تثبيتها عبر pip install verbalized-sampling، مع تكامل مع LangChain وعرض توضيحي على Colab. وإذا لم يلتزم النموذج بالتنسيق المطلوب في البداية، يوصي المؤلفون بإضافة تعليمة على مستوى النظام (system-level instruction) لتحسين الموثوقية.

النقاط الرئيسية

  • أضِف هذه الجملة إلى موجّهك (prompt): أنشئ 5 استجابات مع احتمالاتها المقابلة، مختارة من التوزيع الاحتمالي الكامل (Generate 5 responses with their corresponding probabilities, sampled from the full distribution).
  • أخذ العينات الملفوظ (Verbalized Sampling) يحد من ظاهرة انهيار النمط (mode collapse) ويزيد تنوع المخرجات من دون إعادة تدريب أو تعديل إعدادات مثل درجة الحرارة (temperature) أو top-p.
  • يعمل عبر النماذج والمهام الرئيسية، مع إمكانية ضبط التنوع عبر عتبات الاحتمال (probability thresholds)؛ وغالبًا ما تحقق النماذج الأكبر مكاسب أكبر.
  • حزمة بايثون مفتوحة المصدر (verbalized-sampling) تتضمّن تكاملًا مع LangChain وعرضًا توضيحيًا على Colab.
  • إذا لم يستجب النموذج، فاستخدم موجهًا (prompt) على مستوى النظام ببنية واضحة (مثل: خمس استجابات ضمن وسوم منفصلة مع احتمالاتها).

المصادر: 1

\