Синтез речи — что это такое и как работает

0

Люди ежедневно используют самых разных виртуальных ассистентов. Из-за их популярности синтез речи давно относится к технологиям, постоянно привлекающим интерес разработчиков. Однако, применять архитектуры нейросетей и известные методы недостаточно. В нашей статье кратко расскажем, как работает технология, где используется и какие особенности характерны для нее.

Bigpicture ru синтез речи

Сферы применения синтеза речи

Рассмотрим часто встречающиеся варианты использования синтеза речи.

  • Мобильные приложения. Голосовой помощник может зачитывать статьи, обзоры, пуш-уведомления, сообщения и помогать с навигацией.
  • Колл-центры. В лидирующих компаниях уже 2–3 года ответы на звонки клиентов роботизированы. Умные голосовые помощники детально разбираются в вопросе и, соответственно, быстрее удовлетворяют потребности звонящего. Для бизнеса это выгодное решение из-за адекватной стоимости: не нужно держать в штате или на фрилансе операторов.
  • Гаджеты. Все знакомы с Siri, Google Assistant и Alexa. Вы им — команду, а они вам — ответ. Поддерживают множество функций. Иногда пытаются шутить и подкалывать, получается неплохо.

Принцип работы синтеза речи

Выражать эмоции по-разному и использовать отличающиеся интонации нам позволяют голосовые связки. Нейросеть должна уметь имитировать их. Для этого в SberDevices решили использовать вокодер — синтезатор речи с богатым спектром. Но зачитывать буквы мало. Устройству нужно было научиться правильно расставлять паузы и ударения на значимые слова. С помощью языковой модели BERT архитектуре пришлось освоить контекст и смысл слов. Такой комплекс мер по улучшению продукта позволяет выпускать обученных на высоком уровне и приятных на слух голосовых ассистентов.

Особенности обучения и применения синтеза речи

  • Для обучения устройства еще нужны студийные записи дикторов.
  • Над голосом виртуального ассистента работает большая команда специалистов: войс-коучи, разметчики, дата-сайентисты, разработчики, аналитики.
  • Невозможно угодить всем пользователям: одни хотят естественный по звучанию синтез, а другие — похожий на робота, чтобы отличать машину от человека.

Технологии развиваются каждый день. В ближайшем будущем появятся не только встроенные синтезаторы речи, но и отдельные приложения, через которые пользователь за пару часов или даже минут услышит свой голос в машинном исполнении.

Смотрите также: Топ 100 лучших постов.

А вы знали, что у нас есть Telegram?

Подписывайтесь, если вы ценитель красивых фото и интересных историй!

Популярное

Самые горячие темы

Женщина, которая едва не победила Детройт: афера века с трехколесным автомобилем и жизнь на десяти удостоверениях личности

Женщина, которая едва не победила Детройт: афера века с трехколесным автомобилем и жизнь на десяти удостоверениях личности

Почему блондинок считают глупыми: удивительная история стереотипа

Почему блондинок считают глупыми: удивительная история стереотипа

«Пришелец с Сириуса» из Новосибирска: как выпускник техникума создал секту на 20 000 человек и трижды был арестован

«Пришелец с Сириуса» из Новосибирска: как выпускник техникума создал секту на 20 000 человек и трижды был арестован

Новые посты

10+ самых постыдных случаев из детства, о которых рассказали в интернете

10+ самых постыдных случаев из детства, о которых рассказали в интернете

Волына, перо, пушка: откуда в русском уголовном жаргоне взялись названия оружия

Волына, перо, пушка: откуда в русском уголовном жаргоне взялись названия оружия

Правильное питание за копейки: может ли здоровый рацион быть дешевым

Правильное питание за копейки: может ли здоровый рацион быть дешевым

Йоркшир — графство, где поселился Бог

Йоркшир — графство, где поселился Бог

Зачем нужны швейцары, и как эта профессия стала престижной

Зачем нужны швейцары, и как эта профессия стала престижной

Так вот для чего эта дырочка: 10 привычных вещей, об истинном назначении которых мы не знали

Так вот для чего эта дырочка: 10 привычных вещей, об истинном назначении которых мы не знали

Почему люди считают мел «пищей богов»: извращение вкуса или потребность?

Почему люди считают мел «пищей богов»: извращение вкуса или потребность?

Звезда, которую Голливуд превратил в скандал: как Джейн Расселл обхитрила Хьюза, подружилась с Монро и усыновила 51 000 детей

Звезда, которую Голливуд превратил в скандал: как Джейн Расселл обхитрила Хьюза, подружилась с Монро и усыновила 51 000 детей

Уникальные фотографии 1890-х годов, раскрашенные вручную

Уникальные фотографии 1890-х годов, раскрашенные вручную

Девушки на лестничных клетках — торжество постсоветских подъездов

Девушки на лестничных клетках — торжество постсоветских подъездов

От очередей до олимпийского золота: как советские велосипеды покорили мир

От очередей до олимпийского золота: как советские велосипеды покорили мир

Эффектная GIF-реставрация — как выглядели британские замки в пору своего расцвета

Эффектная GIF-реставрация — как выглядели британские замки в пору своего расцвета