Компания Microsoft представила новый генератор видео, который может создавать реалистичные видеоматериалы на основе одного изображения и аудиодорожки. Эксперты уже назвали этот инструмент "кошмарной машиной для дипфейков".
Алгоритм VASA-1, разработанный компанией Microsoft, позволяет генерировать видео на основе одного изображения и аудиодорожки.
Он особенно выделяется своей способностью к имитации естественных движений головы и мимики, что добавляет видеоряду жизни и правдоподобности."Наша модель способна не только воспроизводить движения губ, синхронизированные со звуком, но и улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют восприятию аутентичности и живости", - указано на сайте Microsoft.
Технически VASA-1 работает в скрытом пространстве лица, где происходит генерация динамики лица и головы. Для генерации необходимо предоставить картинку и аудиодорожку, после чего алгоритм сгенерирует говорящего человека, имеющего естественную мимику и широкий спектр эмоций.
Microsoft отмечает, что новая нейросеть значительно превосходит предыдущие аналоги. Видео доступно в разрешении 512 х 512 с частотой 40 кадров в секунду, имеет небольшую начальную задержку. Однако компания не планирует выпускать продукт на рынок из-за опасений, что он может быть использован мошенниками для создания дипфейк-видео.
В целом, представленная Microsoft новинка является важным шагом в развитии искусственного интеллекта и может стать основой для создания более реалистичных аватаров в будущем.
]]>
Свежие комментарии