طرحت شركة «أوبنAI» وضعاً جديداً باسم «وكيل ChatGPT» (ChatGPT Agent) لمشتركي النسخة المدفوعة من ChatGPT، يتيح للنموذج فتح حاسوب افتراضي، وتسجيل الدخول إلى المواقع وخدمات البريد الإلكتروني، وتنزيل الملفات أو إنشاؤها، وتنفيذ مهام متعدّدة الخطوات من دون إشراف بشري مستمرّ. ولأنّ هذه الحرّيّة قد تفتح الباب لتسرّب البيانات، أو حقن التعليمات الخبيثة، أو حتى مخاطر الأمن البيولوجي (biosecurity)، استدعت الشركة فريق «الاختبار الأحمر» (red-team) المؤلَّف من 16 شخصاً نفّذوا 110 هجمات مختلفة على النظام. وأسفرت نتائجهم عن إضافة مراقبة آنية متعددة الطبقات، وقيود أكثر صرامة على الأدوات، وبروتوكول تصحيح عاجل قبل الإطلاق. وتُقيِّم «أوبنAI» الوكيل حالياً بأنّه «عالٍ الكفاءة» (high-capability) — و«مرتفع الخطورة» — في مجالي الأحياء والكيمياء، وتفعِّل خطَّ فحص لحركة البيانات يغطّي 100٪ من المرور الحيّ (traffic inspection).
غير أنّ الاختبارات التطبيقية الأولى أظهرت أنّ «وكيل ChatGPT» يشبه متدرّباً بطيئاً — وإن كان دقيقاً — أكثر مما يشبه مساعداً خارقاً فورياً. فقد تبيّن للصحفيين أنّه قادر على البحث عن الهدايا أو صياغة رسائل البريد الإلكتروني، لكنّه تعثّر عند محاولة إتمام عمليات شراء، أو معالجة طلبات مصرفية، أو إنهاء مهمّة تسوّق على Etsy استغرقت 50 دقيقة قبل أن يدّعي إكمالها. ويقول مدير العمليات في «أوبنAI» براد لايتكاب إنّ الوكلاء الحقيقيين ينبغي أن ينجزوا أعمالاً جديدة ومعقّدة «بشكل مستقل» (autonomously)، مع بقائهم زملاء عمل لا بدلاء. في الوقت الراهن يتفوّق الوكيل في جمع المعلومات وتلخيصها، بينما يظلّ الإنسان صاحب «النقرة» الأخيرة.
النقاط الرئيسية
- يستطيع «وكيل ChatGPT» تصفّح الويب، وقراءة وكتابة البريد الإلكتروني، والتعامل مع الملفات عبر حاسوب افتراضي مدمج.
- كشف فريق الاختبار الأحمر سبعة مسارات استغلال واسعة النطاق؛ وأفضى تقييمهم إلى مراقبة مزدوجة الطبقات تراجع 100٪ من حركة البيانات الحية.
- تشمل الدفاعات الإضافية إيقافاً تلقائياً عند الوصول إلى مواقع حسّاسة، وتعطيل الذاكرة الطويلة الأجل، وقيود شبكة صارمة داخل الطرفية (terminal) الخاصة بالوكيل.
- أشادت الاختبارات المبكرة بقدرات الوكيل البحثية لكن انتقدت بطء أدائه وعجزه عن إتمام المعاملات التي تتطلّب تسجيل دخول أو عمليات دفع.
- تعرِّف «أوبنAI» الوكيل (AI agent) بأنّه نظام قادر على تولّي أعمال معقّدة غير مسبوقة باستقلالية وموثوقية، مع الاستمرار في العمل جنباً إلى جنب مع البشر لا بدلاً منهم.
في جملة واحدة
يوسّع «وكيل ChatGPT» من «أوبنAI» قدرات الدردشة إلى عامل رقمي شبه مستقل، محصَّن بطبقات أمان مشدّدة صُمِّمت عبر اختبارات حمراء مكثّفة. وعلى الرغم من تعزيز الحماية، تشير التجارب الواقعية إلى أنّ الوكيل حالياً أبرع في جمع المعلومات منه في إنجاز المهام عبر الإنترنت بسرعة.