في جملة واحدة
أصبحت نسخ الأصوات بالذكاء الاصطناعي واقعية إلى حدّ أن معظم الناس لا يستطيعون تمييزها عن الأصوات الحقيقية. يثير هذا التقدّم مخاوف ملحّة تتعلّق بالاحتيال والموافقة، وفي الوقت نفسه يفتح الباب أمام فوائد كبيرة لتعزيز إمكانية الوصول.
التفاصيل
لم يعد معظم الناس قادرين على التمييز بين نسخ الأصوات المُولَّدة بالذكاء الاصطناعي والأصوات البشرية الحقيقية، وفقًا لبحث جديد نُشر في مجلة PLOS ONE. في اختبارات شملت 80 عيّنة صوتية — نصفها بشري والنصف الآخر مُنتَج بالذكاء الاصطناعي — كان المشاركون أفضل بكثير في كشف الأصوات الاصطناعية العامة المُولَّدة من الصفر مقارنةً باكتشاف الأصوات المستنسخة. فعليًا، صُنِّفت 58% من الأصوات المستنسخة بالذكاء الاصطناعي خطأً على أنها حقيقية، بينما جرى التعرّف بصورة صحيحة على 62% من الأصوات البشرية، ما يترك هامشًا إدراكيًا ضئيلًا بين الفئتين. ويشير المؤلفون إلى أن هذه النسخ المُقنِعة أُنتِجت باستخدام أدوات متاحة على نطاق واسع للمستهلكين، ولا تتطلّب سوى حدٍّ أدنى من الخبرة.
تكشف النتائج عن مزيج من المخاطر والفرص. يستخدم المحتالون استنساخ الصوت على نحو متزايد لتقليد أصوات الأحبة وخداع الناس — ولا سيما كبار السن — في ظل تصاعد محاولات الاحتيال عبر الهاتف. كما أثارت التقنية نقاشات أخلاقية في مجالي الترفيه والسياسة، بدءًا من أصوات تُحاكي المشاهير دون إذن وصولًا إلى تسجيلات صوتية بتقنيات التزييف العميق (deepfakes) تُستخدم لنشر المعلومات المضلِّلة. ومع ذلك، يمكن للذكاء الاصطناعي الصوتي أن يكون أداةً قوية لتعزيز إمكانية الوصول؛ إذ يساعد الأشخاص على إعادة إنشاء أصواتهم أو تصميم صوت يُجسّد هويتهم، ويدعم التعليم وإنتاج الكتب الصوتية، بل وحتى ترجمة الصوت بين اللغات. ويحثّ الباحثون المطوّرين على العمل مع خبراء الأخلاق وواضعي السياسات لوضع أطر وضمانات واضحة تتعلّق بالموافقة والملكية والاستخدام المسؤول.
النقاط الرئيسية
- أظهرت الدراسة أن 58% من الأصوات المستنسخة بالذكاء الاصطناعي صُنِّفت خطأً على أنها حقيقية، في حين جرى التعرّف بدقة على 62% من الأصوات البشرية.
- كانت الأصوات الاصطناعية العامة المُولَّدة من الصفر أسهل كشفًا من الأصوات المستنسخة، التي باتت تضاهي التسجيلات الحقيقية في واقعيتها.
- يستخدم المحتالون استنساخ الصوت على نحو متزايد في احتيال المكالمات الهاتفية، مع تعرّض كبار السن لمخاطر أعلى.
- تشمل المخاوف الأخلاقية ملكية الصوت والموافقة وإساءة الاستخدام في الترفيه والسياسة عبر التزييفات العميقة.
- تشمل الفوائد التواصل الداعم، وأصواتًا اصطناعية مخصّصة، وترجمة الصوت بين اللغات لتعزيز إمكانية الوصول.
المصادر: 1