أعلنت كلاود عن إطلاق نموذجين جديدين للذكاء الاصطناعي، مخصّصين لتوليد الأصوات واستنساخها عبر أوامر نصية، في خطوة تعزّز تطبيقات الصوت الاحترافية وصناعة المحتوى.



النموذج الأول، يتيح إنشاء أصوات وفق أوصاف دقيقة تشمل المشاعر ونبرة الصوت وسرعة الإلقاء والعمر والأسلوب، مع تحكّم واسع بالمخرجات. ويتفوّق أداؤه على واجهة OpenAI.

أما النموذج الثاني، فيركّز على استنساخ الأصوات، إذ يمكنه نسخ صوت من مقطع لا يتجاوز ثلاث ثوانٍ وإعادة إنتاجه بعشر لغات مختلفة، مع معدل أخطاء أقل مقارنة بمنافسين مثل ElevenLabs وMiniMax، بحسب الشركة.



وتتوافر الأدوات عبر واجهة برمجة تطبيقات علي كلاود، مع نسخ تجريبية على منصة Hugging Face. ويأتي الإطلاق وسط منافسة متصاعدة في سوق تقنيات الصوت بالذكاء الاصطناعي، مع استخدامات تمتد إلى الإعلانات، والدبلجة متعددة اللغات، والألعاب، والتعليم الإلكتروني، ومراكز الاتصال، مع خفض كبير في الوقت والكلفة مقارنة بالأساليب التقليدية.