“Voicebox”: ابتكار جديد من ميتا لإنشاء وتحرير الكلام بست لغات
هل تودون سماع نصوص مكتوبة بصوت شخص تحبونه وبلغات عديدة؟ أو قد ترغبون بالتحدث بلغات لم يسبق لكم تعلمها بسهولةٍ ويسر؟ هذه ليست مجرد تخيلات، بل هي حقائق ملموسة مع نموذج“Voicebox”، الابتكار الحديث والمتطور من شركة ميتا في مجال الذكاء الاصطناعي لتوليد الكلام.
في تصريح مفاجئ، أعلنت شركة ميتا أمس الجمعة عن تحقيق اختراق معرفي جديد في مجال الذكاء الاصطناعي لتوليد الكلام، وذلك في ظل المنافسة الشديدة مع عمالقة التقنية الأخرى، مثل: “جوجل”، و”مايكروسوفت”، و”أمازون”.
وذكرت ميتا في منشور على مدونتها أنها طورت نموذجًا جديدًا يسمى”Voicebox”، وهو يتميز بقدرته على أداء مهام توليد الكلام – مثل: التحرير، وأخذ العينات، والأسلوب – دون أن يحصل على تدريب خاص للقيام بالمهام، بل قام بتعلمها من سياق الكلام.
قد يهمك قراءة: ImageBind: نموذج ذكاء اصطناعي يربط الوسائط المتعددة بطرق جديدة ومبتكرة
قائمة المحتويات
ما هو نموذج Voicebox؟
“Voicebox” هو نموذج ذكاء اصطناعي توليدي يمكنه المساعدة في تحرير الصوت وأخذ العينات والتصميم. بحيث يمكّن الأشخاص من معالجة الأصوات بسهولة، ويسمح لذوي الإعاقة البصرية بسماع الرسائل المكتوبة من الأصدقاء بأصواتهم، كما يتيح للناس التحدث بأي لغة أجنبية بصوتهم الخاص.
وباستخدام عينة صوتية لا تتجاوز مدتها ثانيتين، يمكن لنموذج “Voicebox” مطابقة نمط الصوت واستخدامه لإنشاء تقنية تحويل النص إلى كلام.
وقالت ميتا: إنه يمكن لنموذج الذكاء الاصطناعي المتعدد الأغراض الجديد إعادة إنشاء جزء من الكلام الذي قاطعه الضجيج، أو استبدال الكلمات المنطوقة خطأً دون الحاجة إلى إعادة تسجيل الكلام مرة أخرى.
“Voicebox” يتيح لكم فرصة استخدام صوتكم في طرق جديدة ومبتكرة. فهو يمكِّنكم من:
1- تحرير الكلام وتقليل الضوضاء:
إذا كان صوتكم مشوهاً أو غير واضحًا بسبب وجود ضجيج أو لفظ خاطئ. فلستم بحاجة إلى تسجيله من جديد، بل يمكنكم استخدام “Voicebox” لتعديله بسهولة. كل ما عليكم فعله هو تحديد الجزء المطلوب، وسيقوم “Voicebox” بإعادة توليده بصوت واضح ونقي.
2- نقل أنماط الكلام عبر لغات متعددة:
تخيلوا أن تتحدثوا لغة لم تدرسوها من قبل بأسلوبكم الفريد! مع “Voicebox”، يمكنكم ذلك. فهو يمتلك القدرة على إنتاج قراءة شاملة للنص بست لغات مدعومة ومنها: (الإنجليزية، والفرنسية، والألمانية، والإسبانية، والبولندية، والبرتغالية). ويفعل ذلك حتى لو كان نموذج الكلام والنص بلغات مختلفة. هذه الإمكانية ستجعلكم تتواصلون مع الآخرين بطريقة أكثر إبداعًا.
3- أخذ عينات متنوعة من الكلام وترجمتها:
يمتلك”Voicebox” أيضًا القدرة على نقل المشاعر. فهو يتعلم من البيانات المتعددة كيفية تحدث الناس في العالم الواقعي وباللغات الست السابق ذكرها.
وتأمل ميتا أن تُستفاد من هذه الإمكانية في المستقبل القريب لمساعدة الأشخاص على التواصل، حتى لو كانوا لا يجيدون اللغات نفسها.
وترى ميتا أن “Voicebox” يُشكّل خطوة هامة إلى الأمام في بحثها في مجال الذكاء الاصطناعي التوليدي، وهي تتطلع إلى مواصلة استكشافها في مجال توليد الكلام والتطبيقات الحديثة.
اقرأ أيضًا:
شركة Meta تدخل عالم الذكاء الاصطناعي بإطلاق نموذج لغوي عملاق مفتوح المصدر
ChatGPT: قصة الروبوت الذكي الذي يتحدث معك ويجعلك تتعلم وتضحك وتستمع!