Бизнес и финансы

Яндекс запустил сервис для быстрого синтеза голоса для бизнеса

Яндекс представил новый сервис Brand Voice Lite для быстрого синтеза речи, доступный на платформе Yandex Cloud. Компании могут загрузить 20-40 минут записи голоса диктора — актера, владельца бизнеса или амбассадора — чтобы создать уникальный голос для голосовых ботов, подкастов или образовательных материалов.

Для добавления эмоций, таких как грусть или агрессия, требуется еще 20 минут записи. Модель синтеза формируется за 7 дней, а доступ к ней предоставляется только заказчику.

Главный технический директор Yandex Cloud Иван Пузыревский отметил, что синтезированные голоса востребованы у банков, ритейлеров и телеком-операторов, которые с их помощью автоматизируют первую линию поддержки. По его словам, технологии SpeechKit уже помогли создать более 50 голосов, а запуск Lite-версии значительно увеличит количество таких проектов.

Сервис использует собственные ML-модели Yandex SpeechKit, которые дообучаются на данных клиента, хранящихся в защищенных дата-центрах. Бизнес обязан получить согласие на использование голоса, а сценарии применения ограничены правилами сервиса.

Согласно данным Fortune Business Insights, глобальный рынок разговорного ИИ в 2024 году составит $12,2 млрд, а в 2025 году вырастет до $14,8 млрд. Российский рынок, по прогнозам Naumen, достигнет 7,45 млрд руб. в 2024 году.

]]>

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов