Яндекс представил новый сервис Brand Voice Lite для быстрого синтеза речи, доступный на платформе Yandex Cloud. Компании могут загрузить 20-40 минут записи голоса диктора — актера, владельца бизнеса или амбассадора — чтобы создать уникальный голос для голосовых ботов, подкастов или образовательных материалов.
Для добавления эмоций, таких как грусть или агрессия, требуется еще 20 минут записи. Модель синтеза формируется за 7 дней, а доступ к ней предоставляется только заказчику.Главный технический директор Yandex Cloud Иван Пузыревский отметил, что синтезированные голоса востребованы у банков, ритейлеров и телеком-операторов, которые с их помощью автоматизируют первую линию поддержки. По его словам, технологии SpeechKit уже помогли создать более 50 голосов, а запуск Lite-версии значительно увеличит количество таких проектов.
Сервис использует собственные ML-модели Yandex SpeechKit, которые дообучаются на данных клиента, хранящихся в защищенных дата-центрах. Бизнес обязан получить согласие на использование голоса, а сценарии применения ограничены правилами сервиса.
Согласно данным Fortune Business Insights, глобальный рынок разговорного ИИ в 2024 году составит $12,2 млрд, а в 2025 году вырастет до $14,8 млрд. Российский рынок, по прогнозам Naumen, достигнет 7,45 млрд руб. в 2024 году.
]]>
Свежие комментарии