تحذير من أزمة جراء غمر الذكاء الاصطناعي للأبحاث العلمية بدراسات منخفضة الجودة ومضللة

تحذير من أزمة جراء غمر الذكاء الاصطناعي للأبحاث العلمية بدراسات منخفضة الجودة ومضللة

يكشف تقرير جديد صادر عن جامعة سري عن قضية متصاعدة في مجال البحث العلمي: وهي الانتشار المتزايد للدراسات ذات الجودة المنخفضة الناتجة عن الذكاء الاصطناعي، والتي تعتمد على منهجيات غير دقيقة وتحليل بيانات مفرط في التبسيط. تتمثل هذه المشكلة، التي تقودها نماذج اللغة الضخمة (Large Language Models) والاعتماد على مجموعات بيانات متاحة على نطاق واسع مثل مسح الصحة والتغذية الوطني الأمريكي (NHANES)، في خطر يهدد نزاهة المحتوى العلمي. وتوضح الدراسة، التي نشرت في دورية PLOS Biology، وجود زيادة في الأبحاث 'الشكلية' التي تسيء استخدام تقنيات الذكاء الاصطناعي لتبسيط العلاقات ذات المتغير الواحد في قضايا صحية معقدة ومتعددة العوامل بطريقة غير مهنية.

تشير بيانات التقرير إلى أنه بين عامي 2014 و2021، كانت الأبحاث المستندة إلى بيانات NHANES محدودة للغاية، بمعدل أقصى يصل إلى أربع دراسات سنويًا. ومع ذلك، شهدت السنوات الأخيرة ارتفاعًا هائلًا، حيث تم نشر 33 دراسة في عام 2022، و82 دراسة في عام 2023، ووصل العدد إلى 190 دراسة خلال الأشهر العشرة الأولى فقط من عام 2024. يؤكد التقرير أن العديد من هذه الدراسات فشلت في تقديم تصوير دقيق لحالات صحية معقدة مثل أمراض القلب والاكتئاب وضعف الوظائف الإدراكية، وبدلاً من ذلك ركزت على تحليلات سطحية تعتمد على متغير واحد فقط. يحذر التقرير بشدة من أن هذه الممارسات لا تؤدي فقط إلى إنتاج استنتاجات مضللة، بل تخلق أيضًا عبئًا إضافيًا على محرري المجلات العلمية ومراجعي الأبحاث، مما يصعّب عملية تحديد الأولويات وتقييم الأبحاث القيمة بشكل مناسب. لتجنب تفاقم هذه المشكلة، توصي الدراسة بوضع معايير صارمة للوصول إلى مجموعات البيانات، وفرض إلزامية تحليل البيانات بشكل شامل، مع عدم استثناء ذلك إلا بتقديم مبررات معقولة، وإجراء تدقيق مكثف للأبحاث التي تعتمد على تحليل متغير واحد، كما يقترح التقرير إطلاق تحذيرات لضمان جودة الدراسات بشكل أفضل.

النقاط الرئيسية

  • تزايدت الأبحاث المولدة بواسطة الذكاء الاصطناعي لتغمر المجلات العلمية، وغالبًا ما تعتمد على منهجيات سطحية وغير دقيقة لتحليل مجموعات بيانات مثل NHANES.
  • شهدت الدراسات الصحية التي تركز على متغيرات فردية ارتفاعًا ملحوظًا منذ عام 2021، مع نسبة كبيرة منها صادرة من الصين.
  • تتجاهل هذه الدراسات المبسّطة الطبيعة المعقدة للأمراض متعددة العوامل، مما يعزز احتمالات تضليل المجتمع العلمي.
  • أوصى الباحثون باتباع معايير جديدة صارمة، مثل فرض تحليل كامل لمجموعات البيانات، واعتماد سياسات تنظيمية للوصول إلى البيانات، وتطبيق عمليات مراجعة متخصصة لمقالات المجلات.
  • يعكس هذا الاتجاه خطرًا أوسع حول غمر المحتوى الذي يتم إنتاجه بواسطة الذكاء الاصطناعي لمجالات متعددة، بمعلومات مضللة أو سطحية تعيق تقدم المعرفة.

في جملة واحدة

يعرض تقرير من جامعة سري مخاطر زيادة الأبحاث الصحية منخفضة الجودة التي يولدها الذكاء الاصطناعي، والتي تسيء استغلال مجموعات البيانات الوطنية وتعتمد على تبسيط مفرط للحالات الصحية المعقدة، مما يهدد نزاهة البحث العلمي ويؤدي إلى نتائج مضللة.

المصادر: 1

\