Библиотека сайта rus-linux.net
Преобразование аудио в текст вручную и с помощью инструментов Google
Преобразовать звуковой файл в текст можно традиционным способом, который не требует никакого дополнительного программного обеспечения. Достаточно открыть любой редактор текста, начать воспроизведение записи (лекции, интервью), и нажимать на паузу после каждой фразы, параллельно записывая услышанное. Этот способ гарантирует практически безошибочную расшифровку, поскольку большинство текстовых редакторов автоматически подчеркивают опечатки и ошибки.
Для автоматизации этого утомительного процесса используют специальные программы и онлайн-сервисы транскрибации. Большинство из них — платные. Однако есть два способа перевести звуковой файл в текст бесплатно.
NB: Если у вас нет голосового файла для транскрибации, но вы хотите протестировать качество приведенных ниже способов, то можно воспользоваться сервисом синтеза речи, который бесплатно переведет введенный текст в речь.
Способ №1 - Транскрибация с помощью Google Translate
Самый простой из них — сервис машинного перевода Google Translate, который поддерживает распознавание более 100 языков, в том числе русского.
Для начала процесса преобразования голоса в текст нажимают на значок микрофона. К сожалению, функция голосового набора доступна только в браузере Google Chrome. Если в текст необходимо перевести заранее сделанную запись, то понадобится микрофон хорошего качества для распознавания звука с диктофона (смартфона или программного плеера). Нужный файл также можно проигрывать в другой вкладке браузера.
Способ №2 - Транскрибация аудио с помощью Google Docs
Есть еще одна бесплатная программа, которая переводит аудио в текст — это встроенная в Google Docs утилита для голосового набора. Функция распознавания речи с мгновенным переводом в текст доступна во всех приложениях сервиса, при условии использования браузера Google Chrome, в других веб-обозревателях опция пока недоступна.
Принцип транскрибации в документах Гугл такой же, как и в переводчике: текст наговаривают на микрофон или используют заранее записанный файл. На корректность расшифровки влияют и качество исходного аудиофайла, и параметры микрофона.
Плюс распознавания голоса (или аудиозаписи) в Google Translate и Docs – автоматическое исправление ошибок и сохранение текста в облачном хранилище. Знаки препинания придется поставить вручную. Стоит отметить, что в сервисе Google Docs нет ограничения на объем символов, тогда как в переводчике есть лимит — 5000 знаков.