الخميس، 23 شوال 1445 ، 02 مايو 2024

أعلن معنا

اتصل بنا

الذكاء الصناعي يستنسخ أصوات البشر في 15 ثانية فقط!

تسجيل صوتي
الذكاء الصناعي يتيح تقنيات هائلة
أ أ
addtoany link whatsapp telegram twitter facebook

كشفت شركة "أوبن إيه آي"، مطورة برنامج المحادثة الشهير "تشات جي بي تي" القائم على الذكاء الاصطناعي التوليدي، عن آلية لاستنساخ الصوت في غضون 15 ثانية فقط. اضافة اعلان
ويحتاج نموذج الذكاء الاصطناعي، المسمى "فويس إنجين"، إلى عينة صوتية واحدة مدتها 15 ثانية فقط لإنشاء خطاب يحاكي صوت المتحدث الأصلي، حسبما أعلنت الشركة. 
وتم تطوير هذه التقنية لأول مرة في أواخر عام 2022، وتم استخدامها لتشغيل الأصوات المحددة مسبقًا المتوفرة في واجهة برمجة تطبيقات تحويل النص إلى كلام، وكذلك في ميزات تطبيقي "ريد ألود و"تشات جي بي تي فويس" .

نتائج رائدة

وتم اختبار هذه التقنية مع شركاء "أوبن آي إيه" وسجلت نتائج رائدة. على سبيل المثال، شاركت الشركة مقطعًا صوتيًا مثيرًا للدموع لفتاة صغيرة تتحدث بفضل الأطباء.
وفقدت الفتاة قدرتها على التحدث بشكل طبيعي بسبب ورم في المخ، وعلى الرغم من أنها لا زالت قادرة على تكوين الكلمات والجمل، إلا أن صوتها لا يبدو بنفس الطريقة التي كان عليها من قبل. 
واستخدم الأطباء مقطعًا صوتيًا سجلته لمشروع مدرسي لاستعادة صوتها الطبيعي حتى لا يبدو ضعيفًا عندما تتحدث.

توليد أصوات تشبه أصوات البشر

وقالت شركة "أوبن آي إيه": "ندرك أن القدرة على توليد أصوات تشبه أصوات البشر خطوة تنطوي على مخاطر كبيرة، خصوصاً في عام الانتخابات هذا".
وأضافت: "نعمل مع شركاء أمريكيين ودوليين من حكومات ووسائل إعلام ومجالات الترفيه والتعليم والمجتمع المدني وقطاعات أخرى، ونأخذ ملاحظاتهم في الاعتبار خلال عملية ابتكار الأداة".

addtoany link whatsapp telegram twitter facebook