دراسة من جامعة هونغ كونغ (HKU) تكشف تراجع نماذج الذكاء الاصطناعي (AI) الصينية في كبح الهلوسة، ما يعزّز الدعوات إلى تدقيقات واقعية

دراسة من جامعة هونغ كونغ (HKU) تكشف تراجع نماذج الذكاء الاصطناعي (AI) الصينية في كبح الهلوسة، ما يعزّز الدعوات إلى تدقيقات واقعية

في جملة واحدة

مراجعة من HKU تُظهر أن الهلوسة لا تزال شائعة عبر نماذج الذكاء الاصطناعي، وأن الأنظمة الصينية متأخرة عن نظيراتها. يخطط المختبر لإجراء تدقيقات واقعية لمساعدة الشركات على اعتماد الذكاء الاصطناعي بأمان وموثوقية.

التفاصيل

يؤكد الأستاذ جاك جيانغ من كلية إدارة الأعمال بجامعة هونغ كونغ (HKU) أن أمان الذكاء الاصطناعي وتطويره مساران متلازمان، وأن مختبر تقييم الذكاء الاصطناعي لديه يعمل كمدقّق مستقل من جهة ثالثة لقياس موثوقية النماذج. وفي أحدث مراجعة شملت 37 نموذجاً صينياً ودولياً، وجد المختبر أن معظمها لا يزال يميل إلى الهلوسة، مع تراجع أداء النماذج الصينية مقارنة بنظيراتها. وقد كان Doubao 1.5 Pro من ByteDance الأفضل أداءً بين النماذج الصينية، لكنه جاء في المركز السابع فقط إجمالاً. وقد فاجأت هذه النتائج الفريق، إذ كانت النماذج الصينية قد أظهرت سابقاً قوة في الاستدلال وتوليد الصور والمهام اللغوية العامة، وجاءت النتائج متسقة في الاختبارات بالإنجليزية والصينية.

ولا يزال سبب هلوسة النماذج محل نقاش؛ فقد اقترحت OpenAI مؤخراً أن أساليب التدريب الحالية تشجّع على التخمين بدلاً من الإقرار بعدم اليقين، وهو طرح قد يقتضي تعديلات في أساليب التدريب أو في بنية النماذج، وفقاً للي جياشين من HKU. وينقل المختبر الآن تقييماته إلى سياقات عمل فعلية، بدءاً من القطاع المالي، لتقديم إرشادات مستندة إلى الأدلة؛ إذ يتعاون مع بنك صيني كبير يتحسّب لمخاطر خدمة العملاء بالذكاء الاصطناعي، ويتعاون أيضاً مع شركة للفيديوهات القصيرة في بكين تبحث عن حلول. ومع دعوة الجهات التنظيمية في هونغ كونغ إلى نهج قائم على المخاطر وتأكيد القادة الوطنيين أولوية الذكاء الاصطناعي الآمن والموثوق، يرى جيانغ أن تقليل الهلوسة وإثبات ذلك عبر تدقيقات مستقلة سيكونان حاسمين لاعتماد المؤسسات.

النقاط الرئيسية

  • اختبر مختبر تقييم الذكاء الاصطناعي التابع لـ HKU 37 نموذجاً ورصد انتشاراً واسعاً للهلوسة؛ أفضل نموذج صيني حلّ في المركز السابع إجمالاً.
  • تظل الهلوسة عائقاً كبيراً أمام الأعمال ولا يمكن تجاهلها في القطاعات عالية المخاطر مثل الرعاية الصحية والتمويل.
  • يشير الباحثون إلى حوافز في التدريب تشجّع على التخمين؛ وقد يتعيّن على المطوّرين تعديل أساليب التدريب والهياكل المعمارية للنماذج.
  • سينقل HKU التقييمات إلى سياقات واقعية، بدءاً بالقطاع المالي، وقد بدأ بالفعل بتقديم المشورة لبنك كبير وشركة للفيديوهات القصيرة.
  • لم يعد تنافس مزوّدي الذكاء الاصطناعي الصينيين مقتصراً على القدرة الخام؛ بل يتطلّب أيضاً أماناً وموثوقية وممارسات أخلاقية قابلة للتحقّق.

المصادر: 1

\