Вышел первый выпуск новостей с цифровой ведущей Еленой

Вышел первый выпуск новостей с цифровой ведущей Еленой

В то время, когда многие ведущие на ТВ ведут себя по одной и той же схеме — как роботы, специалисты по новым технологиям экспериментируют с настоящими роботами. Так, техническое медиа Ferra.ru, входящее в состав Rambler Group, интегрировало в свои новости диджитал-телеведущую Елену. Созданная с помощью нейросетей, она может вести новостные сюжеты, используя только текст для генерации полноценного видеоизображения и речи, а также имитирует мимику и эмоции человека. Первый выпуск с участием Елены уже доступен на сайте Ferra.ru. Каждый, кто его посмотрит, обратит внимание на стандарт женского образа, подобранный для роли телеведущей, и на слегка замедленную, но спокойную способность озвучивать текст новостей.

Нужно сказать, что интонация цифровой ведущей отличается в выгодную сторону от крикливой подачи ее коллег на некоторых телеканалах и даже тех блогеров, которые всеми силами пытаются привлечь к себе внимание.

Елена — цифровой двойник телеведущей, созданный в 2019 году в Лаборатории робототехники Сбербанка с привлечением группы компаний ЦРТ, технологии которой обеспечивают синтез речи аватара.

«Его особенность — в использовании сложных нейросетевых моделей для непрерывной генерации речевого аудиосигнала по тексту. Это позволяет добиться плавности и выразительности искусственной речи, а благодаря мощному лингвистическому процессору прочтение текста выполняется со всеми нормами языка даже в сложных случаях», — поясняется в релизе.

Изображение Елены — тоже результат работы нейросетевых моделей, обученных на видеозаписях реального человека.

«Очевидно, что это только начало пути: в исследовательской части еще очень много актуальных задач, связанных с генерацией фотореалистичных цифровых персонажей, моделированием качественной анимации тела (включая мимику лица и жесты) и различных стилей (одежда, прически, макияж). Отдельная большая задача — заставить такие технологии работать быстро, в идеале — в режиме реального времени», — говорит Николай Симон, руководитель управления разработки виртуальных персонажей SberDevices.

«…Применение нейронных сетей позволило нам вывести качество генерируемой речи на новый уровень. С помощью гибких настроек мы привнесли целый пласт новых возможностей по ее управлению: естественное изменение темпа, тона речи, а также стиля прочтения текста. В ближайшем будущем подобная технология сможет еще точнее моделировать человеческие эмоции и в полной мере будет конкурировать с профессиональными дикторами», — отмечает Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ.




Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *