Рейтинг@Mail.ru

Наши партнеры

UnixForum



Библиотека сайта rus-linux.net



Преобразование аудио в текст вручную и с помощью инструментов Google

Преобразовать звуковой файл в текст можно традиционным способом, который не требует никакого дополнительного программного обеспечения. Достаточно открыть любой редактор текста, начать воспроизведение записи (лекции, интервью), и нажимать на паузу после каждой фразы, параллельно записывая услышанное. Этот способ гарантирует практически безошибочную расшифровку, поскольку большинство текстовых редакторов автоматически подчеркивают опечатки и ошибки.

Для автоматизации этого утомительного процесса используют специальные программы и онлайн-сервисы транскрибации. Большинство из них — платные. Однако есть два способа перевести звуковой файл в текст бесплатно.

NB: Если у вас нет голосового файла для транскрибации, но вы хотите протестировать качество приведенных ниже способов, то можно воспользоваться сервисом синтеза речи, который бесплатно переведет введенный текст в речь.

Способ №1 - Транскрибация с помощью Google Translate

Самый простой из них — сервис машинного перевода Google Translate, который поддерживает распознавание более 100 языков, в том числе русского.

Для начала процесса преобразования голоса в текст нажимают на значок микрофона. К сожалению, функция голосового набора доступна только в браузере Google Chrome. Если в текст необходимо перевести заранее сделанную запись, то понадобится микрофон хорошего качества для распознавания звука с диктофона (смартфона или программного плеера). Нужный файл также можно проигрывать в другой вкладке браузера.


Способ №2 - Транскрибация аудио с помощью Google Docs

Есть еще одна бесплатная программа, которая переводит аудио в текст — это встроенная в Google Docs утилита для голосового набора. Функция распознавания речи с мгновенным переводом в текст доступна во всех приложениях сервиса, при условии использования браузера Google Chrome, в других веб-обозревателях опция пока недоступна.

Принцип транскрибации в документах Гугл такой же, как и в переводчике: текст наговаривают на микрофон или используют заранее записанный файл. На корректность расшифровки влияют и качество исходного аудиофайла, и параметры микрофона.

Плюс распознавания голоса (или аудиозаписи) в Google Translate и Docs – автоматическое исправление ошибок и сохранение текста в облачном хранилище. Знаки препинания придется поставить вручную. Стоит отметить, что в сервисе Google Docs нет ограничения на объем символов, тогда как в переводчике есть лимит — 5000 знаков.

Если вам понравилась статья, поделитесь ею с друзьями: