
Алгоритм исследователей из Вашингтонского университета позволяет создавать реалистичное видео с говорящим человеком на основе записи какого-либо голоса.
Новая разработка может улучшить видеосвязь, кинематограф и виртуальную реальность. Система основана на нейросети с обратной связью. Для обучения разработчики показали программе 17 часов видео с выступлениями Барака Обамы. Затем из записей извлекли отдельные фонемы. На их основе воссоздали мимику и артикуляцию. Цифровую область рта наложили на другой видеоряд, а движения губ, глаз и головы синхронизировали до естественного вида.
В демонстрационном ролике на видеоряд обращения Барака Обамы к американским гражданам добавлены аудиодорожки из других его выступлений.
Технология синтеза речи для видео существовала и раньше. Однако для этого использовались записи людей в экспериментальных условиях. Учёным впервые удалось совместить естественные и различные аудио- и видеозаписи реального человека.
Читать по теме:
- FindFace увеличил поисковую базу до 500 миллионов лиц
- Дональд Трамп — стероиды для Twitter, поэтому соцсеть не будет блокировать его аккаунт
Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru
Автор иконки на тизере: Simon Child, Noun Project

Весь интернет-маркетинг за 19 недель!
Cossa рекомендует: онлайн-курс по интернет-маркетингу от Ingate — digital-агентства с 17-летним опытом.
- 17 учебных блоков по ключевым вопросам интернет-маркетинга
- Поддержка менторов
- Диплом
- Cтажировка в топовых агентствах России
- Помощь в трудоустройстве