تقدم ميتا (Facebook سابقًا) أول عروض ذكاء اصطناعي لها منذ أن انفجرت صناعة مولدات الذكاء الاصطناعي في أواخر عام 2022، حيث من المتوقع أن يكون منشئ تحويل النص إلى صوت للعلامة التجارية، المسمى Voicebox، المكافئ الصوتي لـ ChatGPT، الذي يعالج المطالبات النصية إلى نتائج مكتوبة مفصلة، و Dall-E الذي يطور عملًا فنيًا واقعيًا. سيكون Voicebox بدوره قادرًا على تلقي مطالبات نصية وإنتاج مقاطع صوتية ، وفقًا لـ Engadget.
دربت المولد الجديد على أكثر من "50000 ساعة من الصوت غير المصفى"، بما في ذلك خطاب المجال العام والنصوص باللغات الإنجليزية والفرنسية والإسبانية والألمانية والبولندية والبرتغالية.
وفويس بوكس على استعداد لتطوير النتائج في الكلام الناطق بالمحادثة في مجموعة متنوعة من اللغات المتاحة، تدعي Meta أيضًا أن نموذجها يحتوي على معدل خطأ بنسبة واحد بالمائة، مقارنة بالنماذج الأخرى.
وفقًا لباحثي ميتا تم تدريب النموذج من خلال جعله يتنبأ بكتل الكلام داخل نص بدلاً من الاضطرار إلى تطوير مجموعة عمل من الصفر.
تتمتع الأداة أيضًا بالقدرة على تحرير المقاطع الصوتية للتشويش غير المرغوب فيه أو الكلمات المنطوقة بشكل خاطئ، بطريقة مشابهة لبرامج تحرير الصور الثابتة، مثل Adobe Photoshop.
ذكرت ميتا أنها لا تخطط لإصدار تطبيق Voicebox أو كود المصدر للجمهور حاليًا بسبب "المخاطر المحتملة لسوء الاستخدام".
أصدر مكتب التحقيقات الفيدرالي (FBI) تحذيرًا بشأن الاستخدام المتزايد للمحتوى المزيف العميق في الجرائم، بما في ذلك الابتزاز والابتزاز والمضايقة.
أصدرت الشركة عينات صوتية مع ورقتها البحثية التي قدمت التطبيق، كما يعرض بالتفصيل الخطط المستقبلية المحتملة لمساعدة "المرضى الذين يعانون من تلف في الأحبال الصوتية والشخصيات غير القابلة للعب داخل اللعبة والمساعدين الرقميين".
على الرغم من وجود عدة نماذج من سماعات الرأس Meta Quest VR الخاصة بها ، يبدو أن شركة ميتا لم تعد تمضي قدمًا في خططها لتطوير مفهومها metaverse لصالح المزيد من ابتكار الذكاء الاصطناعي.
وفي الوقت نفسه قدمت آبل مؤخرًا أول سماعة رأس Vision Pro وتستثمر في الواقع الافتراضي، لكن لم تُظهر آبل أي اهتمام كبير بالذكاء الاصطناعي.