Синтез речи — что это такое и как работает

0

Люди ежедневно используют самых разных виртуальных ассистентов. Из-за их популярности синтез речи давно относится к технологиям, постоянно привлекающим интерес разработчиков. Однако, применять архитектуры нейросетей и известные методы недостаточно. В нашей статье кратко расскажем, как работает технология, где используется и какие особенности характерны для нее.

Bigpicture ru синтез речи

Сферы применения синтеза речи

Рассмотрим часто встречающиеся варианты использования синтеза речи.

  • Мобильные приложения. Голосовой помощник может зачитывать статьи, обзоры, пуш-уведомления, сообщения и помогать с навигацией.
  • Колл-центры. В лидирующих компаниях уже 2–3 года ответы на звонки клиентов роботизированы. Умные голосовые помощники детально разбираются в вопросе и, соответственно, быстрее удовлетворяют потребности звонящего. Для бизнеса это выгодное решение из-за адекватной стоимости: не нужно держать в штате или на фрилансе операторов.
  • Гаджеты. Все знакомы с Siri, Google Assistant и Alexa. Вы им — команду, а они вам — ответ. Поддерживают множество функций. Иногда пытаются шутить и подкалывать, получается неплохо.

Принцип работы синтеза речи

Выражать эмоции по-разному и использовать отличающиеся интонации нам позволяют голосовые связки. Нейросеть должна уметь имитировать их. Для этого в SberDevices решили использовать вокодер — синтезатор речи с богатым спектром. Но зачитывать буквы мало. Устройству нужно было научиться правильно расставлять паузы и ударения на значимые слова. С помощью языковой модели BERT архитектуре пришлось освоить контекст и смысл слов. Такой комплекс мер по улучшению продукта позволяет выпускать обученных на высоком уровне и приятных на слух голосовых ассистентов.

Особенности обучения и применения синтеза речи

  • Для обучения устройства еще нужны студийные записи дикторов.
  • Над голосом виртуального ассистента работает большая команда специалистов: войс-коучи, разметчики, дата-сайентисты, разработчики, аналитики.
  • Невозможно угодить всем пользователям: одни хотят естественный по звучанию синтез, а другие — похожий на робота, чтобы отличать машину от человека.

Технологии развиваются каждый день. В ближайшем будущем появятся не только встроенные синтезаторы речи, но и отдельные приложения, через которые пользователь за пару часов или даже минут услышит свой голос в машинном исполнении.

Смотрите также: Топ 100 лучших постов.

Хотите узнать больше? Смотрите Топ-100 лучших постов на БигПикче!

Добавляйте нас в закладки — тут можно посмотреть лучшие посты недели, месяца, года и за все время существования сайта «Новости в фотографиях»

Популярное

Самые горячие темы

Меню популярных советских ресторанов и кафе

Меню популярных советских ресторанов и кафе

7 изобретений, сделанных настолько хорошо, что они никогда не нуждались в улучшении

7 изобретений, сделанных настолько хорошо, что они никогда не нуждались в улучшении

Секс-зависимость: британка переспала со 130 мужчинами до 28 лет, и сейчас жалеет об этом

Секс-зависимость: британка переспала со 130 мужчинами до 28 лет, и сейчас жалеет об этом

Новости партнеров

Новые посты

Ученые выяснили, сколько нужно выпить, чтобы стать звездой танцпола

Ученые выяснили, сколько нужно выпить, чтобы стать звездой танцпола

10 фактов о самых популярных ночных кошмарах

10 фактов о самых популярных ночных кошмарах

Пора гасить свет, парень — каким был секс на Диком Западе

Пора гасить свет, парень — каким был секс на Диком Западе

Черно-белая магия уличных портретов Джулио Магнифико

Черно-белая магия уличных портретов Джулио Магнифико

Нежная эротика фотохудожника Евгения Лозы

Нежная эротика фотохудожника Евгения Лозы

Инфернальные воительницы и сладкие девочки иллюстратора Игоря Ломова

Инфернальные воительницы и сладкие девочки иллюстратора Игоря Ломова

Опасно для здоровья: ученые рассказали, почему нельзя спать со смартфоном

Опасно для здоровья: ученые рассказали, почему нельзя спать со смартфоном

Потерянный рай: что находится в заброшенном особняке стоимостью 224 млн долларов

Потерянный рай: что находится в заброшенном особняке стоимостью 224 млн долларов

До винтика — художник показал, из чего состоят привычные нам вещи

До винтика — художник показал, из чего состоят привычные нам вещи

22 «гадких утенка», которые смогли стать «прекрасными лебедями»

22 «гадких утенка», которые смогли стать «прекрасными лебедями»

«А логика где? А логики нет!»: 20 безумных поступков людей, которым явно не хватает интеллекта

«А логика где? А логики нет!»: 20 безумных поступков людей, которым явно не хватает интеллекта

Как в СССР в столицу за продуктами ездили

Как в СССР в столицу за продуктами ездили