Технологии

Компания Тимура Бекмамбетова займется развитием алгоритма, имитирующего голоса знаменитостей

время публикации: 29 октября 2019 г., 17:51 | последнее обновление: 29 октября 2019 г., 17:51

Vera Voice / youtube.com

Компания кинопродюсера Тимура Бекмамбетова Screenlife Technologies и разработчик HR-сервиса на основе искусственного интеллекта "Робот Вера" "Стафори" объявили о создании совместного предприятия для развития проекта Vera Voice, который позволит имитировать голоса знаменитостей на русском языке.

Как пишет РБК со ссылкой на совместный релиз партнеров, в основе Vera Voice лежат нейросети, которые обучаются копировать речь на примере оригинала. Как сообщил VC.ru сооснователь "Стафори" Владимир Свешников алгоритм синтезирует голос с учетом индивидуальных особенностей произношения слов, скорости речи, интонаций и тембра. Примеры синтезированных голосов, опубликованные на YouTube, звучат весьма реалистично, хотя отдельные слова звучат не вполне натурально.

"Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст "выгружаются" в несколько нейронных сетей одновременно, одна – генерирует спектрограмму звука (его визуальное изображение), а вторая – непосредственно звук", – рассказал Свешников.

Применять Vera Voice партнеры планируют для поздравлений и розыгрышей, а также озвучки рекламных роликов, фильмов, игр и аудиокниг. При этом с людьми, голоса которых будет имитировать алгоритм, планируется заключать договоры. В частности, договор на легальное использование голоса уже подписан с сооснователем студии "Кубик в кубе" Русланом Габидуллиным.

По словам Бекмамбетова, партнеры намерены реагировать на случаи нелегального использования Vera Voice. "Отлавливать подделки и защищать известных людей от несанкционированного копирования их образов – одна из главных задач нашего проекта", – заявил он.

Vera Voice – не первый проект в своем роде. Так, в похожую разработку ранее вложил деньги "Сбербанк". Созданная банком компания АБК в январе этого года представила ролик с синтезированным голосом актера Иннокентия Смоктуновского. В 2016 году открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet представила принадлежащая Google компания DeepMind. Кроме того, известные голоса может имитировать и голосовой помощник Alexa компании Amazon.

Напомним, в начале сентября стало известно, что в марте этого года мошенники при помощи искусственного интеллекта подделали чужой голос и смогли заработать на этом 243 тыс. долларов. Злоумышленники ввели в заблуждение генерального директора неназванной британской энергетической компании – они позвонили ему от имени исполнительного директора немецкой головной компании. Искусно подделанный голос со знакомыми тембром и немецким акцентом попросил срочно перевести венгерскому поставщику 243 тыс. долларов, и ставший жертвой обмана директор компании выполнил его просьбу.