حذر العلماء: أصبح الآن مؤنسنًا رسميًا
بدأ التقدم في تقنيات الذكاء الاصطناعي في إنتاج أصوات واقعية لا يمكن تمييزها تقريباً عن الأصوات البشرية. فوفقاً لدراسة نُشرت في 24 سبتمبر في مجلة PLoS One، يواجه المستمعون الآن صعوبة كبيرة في التمييز بين الأصوات البشرية الحقيقية والأصوات "المزيفة العميقة" المنتجة صناعياً.

في الدراسة، عُرض على المشاركين 80 عينة صوتية مختلفة: 40 صوتاً بشرياً حقيقياً و40 صوتاً تم إنشاؤها بواسطة الذكاء الاصطناعي. تم اعتبار 41 في المائة فقط من الأصوات الاصطناعية التي تم إنشاؤها من الصفر على أنها أصوات بشرية. ولكن بالنسبة للأصوات المستنسخة التي تم إنشاؤها عن طريق النسخ من أشخاص حقيقيين، ارتفع هذا المعدل إلى 58%. وفي المقابل، كان معدل التعرف الصحيح على الأصوات البشرية الحقيقية 62% فقط. وقد أدى ذلك بالعلماء إلى استنتاج أنه لم يكن هناك فرق كبير من الناحية الإحصائية بين الأصوات المزيفة العميقة والأصوات البشرية الحقيقية.
وقالت نادين لافان، المؤلفة الرئيسية للدراسة والخبيرة في علم النفس من جامعة كوين ماري: "الأصوات الاصطناعية مثل أليكسا أو سيري غالباً ما يكون لها نغمة ميكانيكية ومسطحة. ولكن الآن يمكن للذكاء الاصطناعي أن ينتج كلاماً أكثر طبيعية وشبيهاً بالبشر"، هذا ما قالته نادين لافان، عالمة النفس في جامعة كوين ماري، ملخصةً حالة الفن.
وذكرت لافان أيضًا أن 4 دقائق فقط من التسجيل الصوتي كافية لاستنساخ الصوت وأن هذه العملية تتطلب خبرة قليلة جدًا:
"لا تتطلب العملية أي أموال تقريبًا. ومن اللافت للنظر مدى سهولة الوصول إليها وفعاليتها."
ومع ذلك، فإن هذا التطور لا يعد إنجازاً تقنياً فحسب، بل ينطوي أيضاً على مخاطر جسيمة من حيث الأخلاقيات والأمن وحقوق النشر. فقد تكون مصادقة التعرف على الصوت معرضة للخطر؛ حيث يمكن للمحتالين تقليد صوت الشخص وخداع أقاربه.
وبالفعل، وقعت حادثة واحدة من هذا القبيل: ففي 9 يوليو، تعرضت شارون برايتويل للاحتيال في 9 يوليو من قبل شخص مزيف ظنت أنه صوت ابنتها التي كانت تبكي عندما تلقت مكالمة هاتفية. وقالت برايتويل: "لا أحد يستطيع إقناعي بأن الصوت الذي خدعني لم يكن صوتها".
وبالمثل، في أستراليا، تم استنساخ صوت رئيس وزراء ولاية كوينزلاند ستيفن مايلز في محاولة لجذب الناس إلى استثمار وهمي في البيتكوين.
وأشار لافان إلى أن أصوات الذكاء الاصطناعي يمكن أن يكون لها استخدامات إيجابية مثل إمكانية الوصول والتعليم، بالإضافة إلى الجانب المظلم، وذكر لافان أن هذه التكنولوجيا لديها أيضًا القدرة على تعزيز التواصل مع الأصوات المستنسخة حسب الطلب.
ما هو رد فعلك؟






