جنرال لواء

صوت الذكاء الاصطناعي الجديد من Google هو واقعي للغاية


لم يعد الذكاء الاصطناعي جزءًا من العقول الخيالية للخيال العلمي. إذا كنت قلقًا بشأن بعض أحدث تطورات الذكاء الاصطناعي في عام 2017 ، فإن 2018 لا تبدو أفضل. يجب أن يكون أحد التطورات المخيفة هو أحدث تقدم مع الذكاء الاصطناعي لتوليد الصوت من Google.

الآن إذا كنت قد استخدمت أيًا من منتجات Google أو حتى مجرد استخدام خدمة الترجمة من Google ، فأنت على دراية بصوت Google AI. يُعد الصوت الآلي ، المتوفر بصوت ذكر أو أنثوي ، عنصرًا أساسيًا في ثقافتنا تمامًا مثل Siri من Apple أو Cortana من Microsoft.

مع مرور السنين ، بدأ صوت Google يبدو أقل آلية وأكثر شبهاً بالإنسان. في هذه المرحلة ، لا يمكن تقريبًا تمييز Tacotron 2 Google voice AI الجديد عن البشر.

صوت جوجل المولّد بالذكاء الاصطناعي

في ورقة بحثية نُشرت مؤخرًا من قبل الأشخاص في Google ، قدم الفريق تفاصيل لنظام الكلام المثير للإعجاب المسمى Tacotron 2. في الورقة ، يسلط Google الضوء على قدرة الأنظمة على التحدث بشكل متطابق تقريبًا مع المبدعين البشر. يصف الفريق نظام الكلام من الجيل الثاني في التقرير قائلاً: " الTacotron 2 ، بنية شبكة عصبية لتخليق الكلام مباشرة من النص. يتكون النظام من شبكة تنبؤ بميزة التسلسل إلى التسلسل المتكرر التي تقوم بتعيين عمليات دمج الأحرف إلى mel- مقياس الطيف ، متبوعًا بنموذج WaveNet المعدل الذي يعمل كمشفرة صوتية لتجميع أشكال الموجة السائدة من تلك الطيفية."

كما ورد في التقرير ، تتكون التكنولوجيا من شبكتين عصبيتين عميقتين. تترجم الشبكة الأولى النص إلى مخطط طيفي ، ثم ترسلها إلى ملف العقل العميق-إنشاء نظام WaveNet. ما الذي تحصل عليه عند تطبيق هذه الأنظمة؟ صوت يشبه نظرائه من البشر. استمع إلى التسجيل الصوتي الموضح أدناه. أحد التسجيلات هو Tacotron 2 بينما الآخر ممثلة مدفوعة الأجر. هل يمكنك اخباري بالفرق؟

في هذه التسجيلات يقول الصوت "قامت تلك الفتاة بعمل فيديو عن أحمر الشفاه Star Wars."

أو ماذا عن هذا"حصلت على درجة الدكتوراه في علم الاجتماع من جامعة كولومبيا."

إذا سمعت قوة Tacotron 2 ، فاستمع إليها جرب أعاصير اللسان هذه.

"بيتر بايبر اختار حبة مخلل فلفل. كم عدد الفلفل المخلل الذي اختاره بيتر بايبر؟ "

تبيع الصدف على شاطئ البحر. أنا متأكد من أن القذائف التي تبيعها هي أصداف بحرية ".

يقوم الذكاء الاصطناعي أيضًا بعمل رائع في تحليل السياق وفهم المكان الذي من المفترض أن يكمن فيه التوتر. استمع إلى التصريف المثالي الذي تستخدمه في البيان"كان يعتقد أن الوقت قد حان لتقديم الحاضر".

يمكن أن يميز أيضًا الفرق بين المتجانسات ، مثل القدرة على معرفة الفرق بين الفعل الماضي اقرأ والمصدر ليقرأ.حتى بعض الناطقين باللغة الإنجليزية (البشر) قد يواجهون صعوبة مع أولئك الذين يقرؤون بصوت عالٍ!

على الرغم من أن النظام يعاني أحيانًا من نطق الكلمات متعددة المقاطع ، إلا أن Tacotron 2 يقدم بعض الأصوات الصوتية الرائعة. بمجرد الانتهاء من النظام للإنتاج ، من المؤكد أن Tacotron 2 سيكون صوتًا قويًا عبر نظام Google البيئي.


شاهد الفيديو: Greatness never ends: The First Look 2021. Samsung (شهر اكتوبر 2021).