Синтез речи — что это такое и как работает

0

Люди ежедневно используют самых разных виртуальных ассистентов. Из-за их популярности синтез речи давно относится к технологиям, постоянно привлекающим интерес разработчиков. Однако, применять архитектуры нейросетей и известные методы недостаточно. В нашей статье кратко расскажем, как работает технология, где используется и какие особенности характерны для нее.

Bigpicture ru синтез речи

Сферы применения синтеза речи

Рассмотрим часто встречающиеся варианты использования синтеза речи.

  • Мобильные приложения. Голосовой помощник может зачитывать статьи, обзоры, пуш-уведомления, сообщения и помогать с навигацией.
  • Колл-центры. В лидирующих компаниях уже 2–3 года ответы на звонки клиентов роботизированы. Умные голосовые помощники детально разбираются в вопросе и, соответственно, быстрее удовлетворяют потребности звонящего. Для бизнеса это выгодное решение из-за адекватной стоимости: не нужно держать в штате или на фрилансе операторов.
  • Гаджеты. Все знакомы с Siri, Google Assistant и Alexa. Вы им — команду, а они вам — ответ. Поддерживают множество функций. Иногда пытаются шутить и подкалывать, получается неплохо.

Принцип работы синтеза речи

Выражать эмоции по-разному и использовать отличающиеся интонации нам позволяют голосовые связки. Нейросеть должна уметь имитировать их. Для этого в SberDevices решили использовать вокодер — синтезатор речи с богатым спектром. Но зачитывать буквы мало. Устройству нужно было научиться правильно расставлять паузы и ударения на значимые слова. С помощью языковой модели BERT архитектуре пришлось освоить контекст и смысл слов. Такой комплекс мер по улучшению продукта позволяет выпускать обученных на высоком уровне и приятных на слух голосовых ассистентов.

Особенности обучения и применения синтеза речи

  • Для обучения устройства еще нужны студийные записи дикторов.
  • Над голосом виртуального ассистента работает большая команда специалистов: войс-коучи, разметчики, дата-сайентисты, разработчики, аналитики.
  • Невозможно угодить всем пользователям: одни хотят естественный по звучанию синтез, а другие — похожий на робота, чтобы отличать машину от человека.

Технологии развиваются каждый день. В ближайшем будущем появятся не только встроенные синтезаторы речи, но и отдельные приложения, через которые пользователь за пару часов или даже минут услышит свой голос в машинном исполнении.

Смотрите также: Топ 100 лучших постов.

А вы знали, что у нас есть Telegram?

Подписывайтесь, если вы ценитель красивых фото и интересных историй!

Популярное

Самые горячие темы

Как за 10 лет унылый послевоенный Лондон превратился в мировую столицу молодости и стиля

Как за 10 лет унылый послевоенный Лондон превратился в мировую столицу молодости и стиля

Как «Мисс Шотландия» 10 лет ловила серийную мошенницу, которая обманывала женщин под видом врача-мужчины

Как «Мисс Шотландия» 10 лет ловила серийную мошенницу, которая обманывала женщин под видом врача-мужчины

Муза и Жора: почти 50 лет вместе — история любви Георгия Юматова и Музы Крепкогорской

Муза и Жора: почти 50 лет вместе — история любви Георгия Юматова и Музы Крепкогорской

Новые посты

«Это интересно!»: 22 любопытных фото, которыми поделились пользователи сети

«Это интересно!»: 22 любопытных фото, которыми поделились пользователи сети

Подводный проект

Подводный проект

«Бухгалтерия греха»: как средневековые покаянные книги фиксировали сексуальные проступки монахов и монахинь

«Бухгалтерия греха»: как средневековые покаянные книги фиксировали сексуальные проступки монахов и монахинь

Необычные картины Анны Вейант — самой молодой художницы из рейтинга богачей Forbes

Необычные картины Анны Вейант — самой молодой художницы из рейтинга богачей Forbes

История «Адидас» в СССР — от рекордов эпохи Сталина до посиделок в подъездах 90‑х

История «Адидас» в СССР — от рекордов эпохи Сталина до посиделок в подъездах 90‑х

Как Томми Томпсон нашёл 21 тонну золота на дне океана — и получил 10 лет тюрьмы

Как Томми Томпсон нашёл 21 тонну золота на дне океана — и получил 10 лет тюрьмы

Непотопляемая Вайолетт Джессоп, пережившая три крупнейших кораблекрушения XX века

Непотопляемая Вайолетт Джессоп, пережившая три крупнейших кораблекрушения XX века

Как делают восковые фигуры Мадам Тюссо

Как делают восковые фигуры Мадам Тюссо

Это слово живёт в русском языке 150 лет — и никто не знает, что оно такое

Это слово живёт в русском языке 150 лет — и никто не знает, что оно такое

Nad Al Sheba 3 — как выглядит настоящий урбанистический ад

Nad Al Sheba 3 — как выглядит настоящий урбанистический ад

30 необычных фактов о разных странах, которые покажутся вам дикостью

30 необычных фактов о разных странах, которые покажутся вам дикостью

Самые крупные извержения вулканов в XXI веке

Самые крупные извержения вулканов в XXI веке