كشفت دراسة علمية حديثة عن تطوّر مذهل، ومقلق أيضًا، في قدرات
الذكاء الاصطناعي على توليد أصوات بشرية يصعب تمييزها عن الحقيقة، ما يفتح الباب أمام تساؤلات جدية حول مستقبل الثقة في التسجيلات الصوتية.
وأجرت
جامعة كوين ماري في
لندن سلسلة من الاختبارات على تسجيلات "مزيّفة" صُنعت بتقنيات التزييف العميق الصوتي، مستخدمة برامج متنوعة ومتاحة تجاريًا.
النتائج كانت صادمة: أغلب المشاركين لم يتمكنوا من التفريق بين الأصوات الحقيقية وتلك المولّدة بالذكاء الاصطناعي.
وقال الفريق البحثي في دراسته المنشورة بمجلة PLOS ONE العلمية إن التقنية وصلت إلى مستوى مذهل من الدقة، بحيث يمكنها "استنساخ الصوت
البشري بشكل واقعي تمامًا"، سواء بتقليد أشخاص حقيقيين أو بابتكار أصوات جديدة بالكامل لا نظير لها في الواقع.
وأوضحت
الدكتورة نادين لافان، وهي محاضِرة بارزة في علم النفس بالجامعة، أن "الأمر لم يعد مسألة تخيّل، بل أصبح واقعًا ملموسًا"، مضيفة أن إنتاج صوت مزيف مقنع "يتطلب دقائق قليلة فقط من التسجيلات الأصلية وخبرة محدودة جدًا، وتكلفة شبه معدومة".
ولفتت إلى أن الأدوات المستخدمة في الدراسة متاحة تجاريًا ويمكن لأي شخص تنزيلها، مما يزيد من مخاطر إساءة الاستخدام في مجالات مثل الاحتيال أو التضليل الإعلامي أو انتحال الهوية.
وفي تفاصيل الدراسة، استمع المشاركون إلى مزيج من الأصوات البشرية الحقيقية وأخرى اصطناعية جرى توليدها بطريقتين:
- الأولى عبر محاكاة أصوات أشخاص حقيقيين من تسجيلاتهم الأصلية.
- الثانية من خلال نماذج صوتية ضخمة تولّد أصواتًا جديدة تمامًا دون مرجع بشري.
وطُلب من المشاركين تحديد أي الأصوات بدت أكثر واقعية أو إقناعًا أو تأثيرًا، وكانت المفاجأة أن النتائج جاءت متقاربة جدًا إلى حد التطابق في بعض الحالات.
وأضاف الباحثون أن هذا التقدم "يمثل نقطة تحول في العلاقة بين التكنولوجيا والإدراك البشري"، داعين إلى إطلاق أبحاث عاجلة حول كيفية تمييز الناس بين الأصوات الحقيقية والمزيفة، خصوصًا في ظل الانتشار الواسع لمحتوى الذكاء الاصطناعي عبر الإنترنت.
وتختتم لافان بتحذير لافت: "نحن ندخل مرحلة يصبح فيها من المستحيل تصديق كل ما نسمعه، حتى لو بدا حقيقيًا تمامًا."