Delphi-2M: نموذج شبيه بجي بي تي (GPT) يتنبأ بمخاطر الأمراض طوال الحياة انطلاقًا من السجلات الصحية

Delphi-2M: نموذج شبيه بجي بي تي (GPT) يتنبأ بمخاطر الأمراض طوال الحياة انطلاقًا من السجلات الصحية

عمد الباحثون إلى مواءمة تقنيات نماذج اللغة الكبيرة للتنبؤ بكيفية تغيّر صحة الأفراد عبر الزمن. يتعلّم نظامهم، المسمّى Delphi-2M، أنماطًا في السجلات الطبية المُجهَّلة — مثل التشخيصات ودخول المستشفى وعوامل نمط الحياة — ليقدّر احتمال وتوقيت أكثر من 1,000 مرض، بالإضافة إلى الوفاة. وبعد تدريبه على بيانات نحو 400,000 مشارك في بنك المملكة المتحدة الحيوي (UK Biobank) واختباره خارجيًا من دون إعادة تدريب على 1.9 مليون شخص في الدنمارك، يقدّم Delphi-2M احتمالات على غرار توقعات الطقس بدلًا من نتائج يقينية، ويمكنه أيضًا محاكاة مسارات صحية مستقبلية معقولة لمدة تصل إلى 20 عامًا.

في الاختبارات الداخلية، كانت دقّة تنبّؤ Delphi-2M بالتشخيص التالي مماثلة لأداء النماذج الراسخة الخاصة بكل مرض على حدة (متوسط المساحة تحت المنحنى AUC المعدّلة للعمر والجنس نحو 0.76)، وظلّ مفيدًا على آفاق زمنية أطول، مع تراجع طفيف في الأداء على البيانات الدنماركية (متوسط AUC نحو 0.67). وتدعم قدرته التوليدية البحث المحافظ على الخصوصية عبر إنشاء مجموعات بيانات تركيبية تحافظ على الأنماط ذات الدلالة. كما تكشف تحليلات الذكاء الاصطناعي القابل للتفسير عن عناقيد من الأمراض المصاحبة وآثار زمنية مختلفة للمخاطر (مثلًا: ترفع السرطانات مخاطر الوفاة على مدى سنوات، بينما تتلاشى آثار تعفّن الدم بسرعة أكبر). الأداة ليست جاهزة بعد للاستخدام السريري، وهي تعكس تحيّزات في بيانات تدريبها (مثل نطاق الأعمار في UK Biobank وفجوات مصادر البيانات)، غير أن الباحثين يرون فيها وعودًا بالتنبيه المبكر للمخاطر، وصياغة استراتيجيات التحري، والتخطيط الصحي طويل الأمد.

النقاط الرئيسية

  • Delphi-2M هو نموذج قائم على المحوِّل (Transformer) يقدّر كلًا من المرض الأرجح حدوثًا تالياً وتوقيت حدوثه، عبر أكثر من 1,000 حالة مرضية بالإضافة إلى الوفاة.
  • تدرّب على نحو 0.4 مليون سجل من UK Biobank وتم اختباره خارجيًا على 1.9 مليون سجل دنماركي من دون إعادة تدريب؛ متوسط AUC الداخلي نحو 0.76، والخارجي نحو 0.67.
  • يمكن للنموذج توليد مسارات صحية تركيبية واقعية وطويلة الأمد؛ نسخة دُرِّبت على بيانات تركيبية فقط أدّت بفارق يقارب ثلاث نقاط مئوية في AUC مقارنةً بالأصلية.
  • تُبرز التحليلات القابلة للتفسير عناقيد الأمراض المصاحبة وفروقًا في الديناميكيات الزمنية للمخاطر (مثلًا، آثار السرطانات المستدامة مقابل آثار تعفّن الدم الأقصر عمرًا).
  • ليس جاهزًا للاستخدام السريري بعد: قد تعكس النتائج تحيزات العينة (نطاق الأعمار، فجوات مصادر البيانات)؛ تشمل التحسينات المخططة إدماج بيانات التصوير والوراثة والدم.

في جملة واحدة

Delphi-2M، نموذج شبيه بجي بي تي (GPT)، يتنبأ باحتمالية وتوقيت أكثر من 1,000 مرض من خلال التعلّم من سجلات صحية واسعة النطاق. ورغم أنه غير جاهز للاستخدام السريري بعد، فإنه يُظهر قدرات تنبؤية وتوليدية قوية قد تدعم الوقاية، والتحري، وتخطيط الأنظمة الصحية.

المصادر: 1 2

\