Microsoft представила генератор видео, копирующий человеческую мимику

Компания Microsoft представила новый генератор видео, который может создавать реалистичные видеоматериалы на основе одного изображения и аудиодорожки. Эксперты уже назвали этот инструмент "кошмарной машиной для дипфейков".

Алгоритм VASA-1, разработанный компанией Microsoft, позволяет генерировать видео на основе одного изображения и аудиодорожки.

Новости СМИ2

Он особенно выделяется своей способностью к имитации естественных движений головы и мимики, что добавляет видеоряду жизни и правдоподобности.

"Наша модель способна не только воспроизводить движения губ, синхронизированные со звуком, но и улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют восприятию аутентичности и живости", - указано на сайте Microsoft.

Технически VASA-1 работает в скрытом пространстве лица, где происходит генерация динамики лица и головы. Для генерации необходимо предоставить картинку и аудиодорожку, после чего алгоритм сгенерирует говорящего человека, имеющего естественную мимику и широкий спектр эмоций.

Microsoft отмечает, что новая нейросеть значительно превосходит предыдущие аналоги. Видео доступно в разрешении 512 х 512 с частотой 40 кадров в секунду, имеет небольшую начальную задержку. Однако компания не планирует выпускать продукт на рынок из-за опасений, что он может быть использован мошенниками для создания дипфейк-видео.

В целом, представленная Microsoft новинка является важным шагом в развитии искусственного интеллекта и может стать основой для создания более реалистичных аватаров в будущем.

]]>

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов