أعلنت شركة ByteDance، المالكة لتطبيق TikTok، عن نموذج GR-3، وهو نموذج «رؤية–لغة–عمل» جديد يمكّن الروبوتات من فهم اللغة اليومية وتنفيذ الأعمال المنزلية الشائعة. يستطيع هذا النظام تفسير تعليمات مثل «علِّق القميص الأكبر على الرف الأيسر»، والتعرّف على أجسام لم يسبق له رؤيتها، والاستدلال على حجمها أو موضعها، وكل ذلك من دون أي برمجة إضافية.
وعند إقران نموذج GR-3 بروبوت المختبر «ByteMini» التابع لـ ByteDance، تمكّن الروبوت من إدخال علاقة داخل قميص، وتعليقه على رفّ الملابس، وانتقاء عناصر مفردة وترتيبها في مواقعها المخصّصة، رغم أن بيانات تدريبه تضمّنت حصراً ملابس بأكمام طويلة. يبرز هذا الإطلاق توسّع ByteDance المتزايد في أبحاث الذكاء الاصطناعي المتقدّمة خارج جذورها في وسائل التواصل الاجتماعي، ويشير إلى مستقبل قد يصبح فيه الروبوت الاستهلاكي مساعداً منزلياً قادراً.
النقاط الرئيسية
- يربط GR-3 بين الرؤية واللغة والعمل، ما يسمح للروبوتات بتنفيذ أوامر باللغة الطبيعية.
- يتيح النموذج للروبوتات التعميم على أجسام وبيئات وأحجام ومواقع جديدة.
- استخدم روبوت ByteMini، وهو روبوت جوّال ثنائي الذراعين، GR-3 لتعليق الملابس وترتيب الطاولات في اختبارات مخبرية.
- يُظهر المشروع طموحات ByteDance المتصاعدة في مجال الذكاء الاصطناعي خارج TikTok.
في جملة واحدة
كشفت ByteDance عن GR-3، وهو نظام ذكاء اصطناعي يمكّن الروبوتات من فهم التعليمات المنطوقة وأداء مهام يومية مثل تعليق الملابس والتنظيف. يؤكّد هذا الإنجاز توجّه الشركة المتصاعد نحو الابتكار في الذكاء الاصطناعي المتقدّم والروبوتات المنزلية.
المصادر: 1