В первой части мы определили цели эксперимента и задали критерии отбора сервисов синтеза речи. Рассмотрели, как правильно составлять текст сообщения для озвучки и в чем отличие от специфики составления текста для СМС.
Навигация по разделам статьи:
А теперь переходим к самому интересному – сравнению онлайн-сервисов, с помощью которых можно конвертировать текст в голос.
Оценка сервиса определялась критериями соответствия требованиям эксперимента: простота и скорость по условиям эксперимента важнее, чем возможности самого сервиса.
Под каждым скрином – запись, сделанная с использованием описываемого сервиса синтеза речи. И, исходя из длительности записи – стоимость одной отправки такого сообщения абоненту.
Оценка:
Послушать, что получилось:
по тарифу ПосекундноПРО
Скачать файл:
Не словарные названия: справился
Простота использования: очень просто
Сложные сочетания слов: справился
Доп. настройки: 4 скорости
Ограничение по количеству символов: 50 000
Недостатки: пожалуй, только наличие всего одного (женского) голоса в русской версии
Очень простой сервис, полностью бесплатный. Ограничение на количество символов 50 000 знаков – рассчитан на конвертирование текста в аудиокниги.
Голос – кодек Татьяна с IVONA
Оценка:
Мужской голос (Максим):
Женский голос (Татьяна):
по тарифу ПосекундноПРО
Скачать файл:
Не словарные названия: справился
Простота использования: очень просто
Сложные сочетания слов: справился
Доп. настройки: выбор пола
Ограничение по количеству символов: 200
Недостатки: 200 символов – может не хватить, нет регулировки скорости, музыка на заднем плане
Также, как и в первом случае, используются кодеки IVONA. Можно выбрать пол. В платной версии защитной музыки на заднем плане не будет. При регистрации дают 2 кредита бесплатно. Можно использовать для разовой записи мужским голосом, либо если хотим записать сразу с музыкой. Женский проще получить на любой скорости абсолютно бесплатно, используя первый сервис. Тарификация: 200 знаков – 1 кредит. В целом, платная версия от 4 евро ( = 3 кредита)
Оценка:
по тарифу ПосекундноПРО
Скачать файл: необходимо зарегистрироваться и получить accessKey и accessToken
Не словарные названия: да
Простота использования: подойдет тем, кому требуется частое использование синтеза речи.
Сложные сочетания слов: справился
Доп. настройки: выбор пола
Ограничение по количеству символов: нет
Недостатки: Для единоразового использования – сложен.
В эксперименте не набрал высокий балл, так как не лучший вариант для единоразового использования. Кодеки IVONA – одни из лучших. После регистрации – год бесплатно. Если синтез речи требуется применять часто – то лучший. После года триального периода – низкие цены.
Оценка:
Мужской голос (Александр):
Женский голос (Елена):
по тарифу ПосекундноПРО
Скачать файл: ввод капчи и подождать до трех минут
Не словарные названия: да
Простота использования: капча, принимающаяся не с первого раза. Приходится ждать загрузки.
Сложные сочетания слов: четко , но очень синтетическая речь
Доп. настройки: выбор пола, выбор скорости
Ограничение по количеству символов: ?
Недостатки: Нет возможности прослушать файл до загрузки. Что получилось, можно понять только после скачивания файла. Даже если помучаться с настройками вслепую, такого качества, как у голосов IVONA – не будет.
Примеры записей: максимальное качество, которое получилось выжать из сервиса. Пользоваться сервисом, несмотря на доступность тоже не удобно. Приведен больше для сравнения.
Оценка:
Кодек Юрий:
по тарифу ПосекундноПРО
Скачать файл:
Не словарные названия: да
Простота использования: просто
Сложные сочетания слов: справился
Доп. настройки: выбор пола
Ограничение по количеству символов: нет
Недостатки: не подойдет тем, кто предпочитает Windows
Хотя это решение – и не онлайн-сервис. Однако, не требует установки дополнительного ПО и прост в использовании. К тому же мужской голос мне нравится больше, чем у IVONA. 2 из трех русскоязычных кодеков мак можно прослушать онлайн на сервисе linguatec (нет возможности скачать без покупки – поэтому не включен в обзор)
Пожалуй, это все сервисы, которые заслуживают внимания в качестве синтезатеров речи. Остальные сервисы откровенно не дотягивают, или требуют сложной интеграции, которая никак не удовлетворяет условиям эксперимента: быстро и бесплатно. За исключением сервиса 2uha, остальные вполне подойдут не только для автоинформирования , но даже могут заменить диктора при записи голосового приветствия. Разумеется, такого разнообразия как с живым дикторским голосом не будет. Но если сроки поджимают и оригинальность не требуется, то можно использовать и синтезированные голоса.
Если роботы все-таки вам не нравятся, то запись на диктофон может стать самым быстрым решением.
Необходимые условия:
Советы от специалиста по звуку: хотите добиться правильной акустики – вас должно окружать «мягкое пространство» – можно залезть под одеяло. Профессионалы утверждают, что лучшее моделирование студии звукозаписи в домашних условиях: записываться в шкафу с одеждой 🙂
Подводный камень записи на диктофон – не поймать паузы в начале и конце записи, хотя их всегда можно отрезать.
Записать голосовое сообщение с использованием онлайн синтезаторов речи – реально. Это будет не дольше составления текста для СМС-сообщений, хотя имеет свои нюансы. Миф о том, что такая запись трудоемка – развеян. Поэтому они все-таки остаются более выгодными: минимальная стоимость оптимизированной СМС в эксперименте составила 1 руб 40 копеек, против 33 копеек средней стоимости голосового уведомления.
Можно ли использовать конвертеры текста для голосовых приветствий? Оригинальности для записи голосового приветствия добиться не удастся, в силу отсутствия разнообразия. Однако, и для этих целей сервисы конвертации текста в голос пригодны, если правильно составить текст сообщения.