можно ли запись диктофона преобразовать в текст
Как превратить голос в текст: тестируем 5 сервисов для расшифровки
Я работаю с текстом и мечтаю о программе, которая сможет превратить голос в напечатанные слова.
Например, расшифрует за меня интервью длиной в несколько часов. Или позволит наговорить идеи, а в ответ пришлет заметку. Наконец, «напишет» за меня смс: поймет несколько обрывистых фраз и отправит адресату текст — потому что голосовые сообщения любят не все.
Я протестировал 5 таких сервисов: наговорил один и тот же текст, а потом сравнил результаты. Я использовал два способа: сначала давал программе послушать и расшифровать живой голос, а потом — в записи.
Текст для теста
Вот текст для теста: «Привет. Это тестовая запись для статьи об инструментах, которые умеют превращать голос в текст. Как думаете, этот сервис справится? Распознает интонацию вопроса и, например, числа — один, два, три? Вот что получилось».
Google Keep
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. Это приложение для создания и хранения заметок можно использовать как расшифровщик. Если на главном экране нажать на иконку микрофона и начать говорить, то сервис будет переводить звук в текст — это называется транскрибацией. Загрузить и расшифровать аудиофайл не получится.
У сервиса есть еще один минус: запись останавливается, если молчать две-три секунды, поэтому расшифровывать длинные интервью не получится. Разве что делать это небольшими кусками. Наговорить несколько идей и получить их в блокноте получится отлично.
Результат. Я проверил два способа: наговорил текст самостоятельно и включил запись того же текста через колонку — никакой разницы нет. Вышло хорошо: сервис не распознал только знаки препинания и напечатал числа без пробелов.
Сообщения «Вконтакте»
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. В мобильном приложении соцсеть умеет расшифровывать входящие голосовые сообщения. Это можно использовать и в наших целях: отправлять сообщения самому себе.
Для этого зайдите в раздел с диалогами и в поисковом окне вбейте свое имя. Дальше зажмите значок микрофона и наговорите сообщение. Когда оно появится в диалоговом окне, нажмите на «Аа» справа от записи.
Результат. «Вконтакте» расшифровал живой голос с ошибками в склонениях и перепутал несколько слов: например, «сервис» услышал как «серый». Но справился с числами. Записанный и пропущенный через колонку голос сервис расшифровал намного хуже — получился набор слов, который нужно буквально переписывать.
7 способов перевода аудио и видео в текст
Владельцам сайтов, которые постоянно выкладывают видео и аудиоконтент, стоит помнить о тех, кто по тем или иным причинам просмотреть или прослушать информацию не может. Зато может ее прочитать.
Расшифровка аудио и видеофайлов — занятие нудное и не самое приятное. Но мы живем в век технологий, а, значит, к нашим услугам множество возможностей, чтобы транскрибировать аудио и видеофайлы.
В этой статье мы расскажем, как легко и быстро перевести аудио и видео в текст.
Способы перевода аудиозаписей и видео в текст
1. Онлайн-конвертеры
Для преобразования видео или аудио в текст можно использовать онлайн-сервисы. Качество расшифровки у платных сервисов обычно на порядок выше, чем у бесплатных. Но если качество записи аудио изначально высокое, то и бесплатные конвертеры могут хорошо справиться с задачей преобразования видео в текст онлайн и расшифровкой аудио.
Вот несколько сервисов, которые могут быть вам полезны, когда необходимо записать текст с видео или расшифровать аудиофайл.
Использование сервиса Google Документы — самый простой и доступный любому способ перевести видео в текст или расшифровать аудио.
Чтобы перевести видео в текст онлайн, необходимо открыть и запустить функцию «Голосовой ввод» во вкладке «Инструменты». Если одновременно включить воспроизведение видео или аудио рядом с микрофоном, система начнет сама набирать текст. Конечный результат зависит от качества звука и отсутствия посторонних шумов.
Онлайн-сервис Speechpad позволяет через браузер Google Chrome переводить речь в текст. Имеет поддержку русского языка. Может преобразовать в текст речь, сказанную на микрофон компьютера, получить текст с видео или перевести аудиофайл в печатный текст.
Зарубежный сервис Dictation поддерживает более 100 языков, в том числе русский. Принцип работы схож с функцией «Голосового ввода» в Google Документах, так как сервис использует алгоритмы распознавания речи Google.
Надиктованный текст можно отредактировать, а затем сохранить, отправить на печать, по email или опубликовать в интернете.
Онлайн-сервис RealSpeaker станет хорошим решением для пользователей, которые хотят расшифровать звуковые дорожки и видеофайлы. Конвертер имеет поддержку русского языка. Из недостатков — текстовая расшифровка файлов, длина которых превышает полторы минуты, будет платной.
Бесплатный сервис Speechlogger умеет распознавать речь и мгновенно переводить ее в текст. Готовый документ можно сохранить в форматах txt, doc, srt, загрузить на Google Диск, отправить по email или распечатать. Регистрация не требуется.
Отличный сервис, который может перевести аудио или преобразовать видео в текст. Имеет поддержку русского языка. Для использования необходима регистрация.
Система за пару минут делает расшифровку и отправляет ссылку на готовый вариант на электронную почту. Сервис умеет распознавать даже песни.
У сервиса предусмотрено несколько тарифных планов. Бесплатная версия включает только 30 минут расшифровки аудио в формате MP3. Если вы исчерпали лимит, за транскрибацию придется заплатить, выбрав один из тарифов.
2. Профессиональные сервисы расшифровки
Наиболее качественный вариант перевода аудио в текст обеспечивают профессиональные сервисы расшифровки. Единственный их недостаток — они платные. Но и достоинств у них больше по сравнению с бесплатными способами — качественная расшифровка, предсказуемый результат.
Для расшифровки аудио и видео на русском языке пока существует только один профессиональный сервис — Zapisano. Помимо русского он также поддерживает английский, французский, испанский, итальянский, немецкий и другие языки. Расшифровку текстов осуществляют специалисты.
Для начала работы необходимо загрузить файл или вставить на него ссылку.
Ставки за расшифровку начинаются от 19 рублей за минуту и зависят от срочности исполнения и сложности материала. Тестовая расшифровка бесплатна.
Специалисты не только расшифруют текст, но и расставят знаки препинания, проверят орфографию и сделают легкую редактуру, убрав слова-паразиты и оговорки.
3. Программное обеспечение для десктопных устройств
Существует множество платных и бесплатных версий ПО, которые позволяют конвертировать видео в текст. И аудио тоже. Принцип работы и функционал такого программного обеспечения схож с онлайн-сервисами. Но если онлайн-конвертеры требуют подключения к интернету, ПО можно использовать всегда, когда необходимо перевести звук из видео в текст или преобразовать в текст аудио.
Эта отечественная программа для перевода видео в текст работает на ОС Windows. Она станет помощником для тех пользователей, которые не хотят расшифровывать аудиофайлы самостоятельно. Текст можно наговорить в микрофон, взять готовую аудиозапись или звуковую дорожку из видео. Программа работает со всеми популярными аудиоформатами. Программа осуществит и перевод видео в текст. Качество расшифровки — довольно высокое. Единственный и главный минус — программа платная.
Программа Express Scribe для Windows позволяет расшифровывать аудио и видео вручную. Для этого в программе предусмотрены кнопки воспроизведения, паузы и скорости проигрывания записей. Если самостоятельно набирать текст не хочется, можно включить запись, установить нужную скорость, выставить громкость и дополнительно запустить любой сервис голосового ввода, например, Google Документы.
Недостаток программы — нет версии на русском языке. При этом она интуитивно понятна и проста в использовании.
4. Приложения для смартфонов
Функция голосового ввода и распознавания речи реализована во многих приложениях для смартфонов и планшетов. Работает также, как ПО для десктопов и онлайн-сервисы. Для расшифровки аудио или распознавания текста с видео требуется открыть приложение, включить голосовой ввод и нажать воспроизведение звуковой дорожки рядом с микрофоном мобильного устройства.
Приложение для Android с функцией преобразования речи в текст. Умеет набирать текст под диктовку. Из недостатков — не работает без подключения к интернету.
Android-приложение, которое поддерживает русский язык и умеет распознавать речь. Просто включите рядом с микрофоном ролик, в котором хотите преобразовать видео в текст.
Готовый текст приложение сохраняет в виде заметки, которую можно отредактировать или отправить.
Приложение для iOS, предназначенное для голосового ввода текста. Надиктованный текст можно редактировать и отправить на почту, в Facebook или Twitter. Есть поддержка русского языка. Работает только при подключенном интернете.
5. Расшифровка видео в текст с помощью YouTube
Когда вы ищете конвертер видео в текст, YouTube может оказаться последним сервисом, который придет к вам в голову. Однако многие успешно используют возможности видеохостинга для расшифровки видеозаписей. Все, что нужно, чтобы получить готовый текст из видео, загрузить ролик на сервис. YouTube автоматически сгенерирует субтитры для видео, которые можно будет скопировать и вставить в документ. Расшифрованный текст для видео готов!
6. Расширения для браузеров
Найти бесплатное расширение для браузера, которое качественно может сделать из видео текст или расшифровать звуковую дорожку, задача не из легких. Те, кто готовы к экспериментам и небольшим денежным затратам, могут попробовать следующие плагины из нашего списка.
Полезное расширение для браузера Chrome с функцией распознавания голоса. Может использоваться для диктовки текстов для разных сайтов, даже для заполнения форм или оставления комментариев. Если рядом с микрофоном включить аудио или видео, приложение будет набирать текст в документе. Поддерживает более 120 языков. Пробная версия бесплатна. Тем, кто захочет полноценно пользоваться расширением, придется его купить.
Chrome-приложение с функцией распознавания голоса. Имеет поддержку более 60 языков, в том числе русского. Работает по тому же принципу, что и другие сервисы распознавания речи: вы диктуете или включаете запись, приложение набирает текст. Видео также можно расшифровать, если поднести устройство с записанным роликом близко к микрофону.
Программа может использоваться для заполнения форм на сайтах, диктовки электронных писем. Умеет распознавать голосовые команды и даже позволяет с их помощью просматривать веб-страницы. Например, можно попросить перейти к другому полю, прокрутить страницу вверх или вниз, открыть вкладки или запустить воспроизведение песни с помощью голосовых команд. Также можно попробовать использовать данную программу для расшифровки видео в текст или транскрибации аудио.
7. Преобразование речи в текст в Windows
Владельцы подписки Office 365 могут использовать функции диктовки для преобразования аудио в текст. Для начала требуется войти в учетную запись и активировать микрофон. Затем необходимо включить функцию диктовки. Произнесенный в микрофон текст отобразится на экране.
Также владельцы ПК, у которых установлена ОС Windows 8 и 10, могут преобразовывать речь в текст безо всякого дополнительного ПО. Для этого необходимо активировать «Распознавание речи», а потом можно диктовать тексты прямо в документы.
Самостоятельная расшифровка
Ничто не заменит старой доброй ручной расшифровки видео и аудио, если нужны 100% точность и качество. Чтобы работа проходила эффективнее, существуют приложения и программы, облегчающие транскрибацию. Например, oTranscribe или уже упомянутый Express Scribe помогают видеть перед глазами аудио или видео, сразу вводить прослушанный текст, также имеют горячие клавиши для остановки и включения записи.
Если самостоятельно заморачиваться с расшифровкой лень, всегда можно обратиться к фрилансерам. На любой бирже фриланса можно найти исполнителей, которые помогут записать текст с видео или аудио за небольшую плату. Расшифровка одной минуты аудио или видео в среднем обойдется в 10 рублей.
Заключение
Перед каждым из нас однажды может остро встать вопрос, как перевести видео в текст или расшифровать аудио с минимальными усилиями с нашей стороны. Выбор способа транскрибации будет зависеть от материальных возможностей, срочности выполнения задачи и качества звука. Будьте готовы, что наилучший результат дают платные программы для преобразования видео в текст. А в некоторых случаях, когда качество записи очень плохое и слышны посторонние шумы, придется взяться за расшифровку самостоятельно или прибегнуть к услугам фрилансеров.
Перевод аудио в текст — 12 программ для транскрибации
Если Вам понадобился перевод аудио в текст, то Вам понадобятся программы для транскрибации. Можно конечно, и вручную переводить. Точнее «в ушную» 🙂 Но, согласитесь, это как-то сильно уж неправильно… Хотя я лично знаю таких вундеркиндов, которые зарабатывали на транскрибации без всяких программ некоторое время. Просто потому, что не знали, что они существуют 🙂 Но я отвлекся…
Итак. Для транскрибации, то есть перевода голоса в текст, можно использовать или программы, или специальные онлайн сервисы. Или комплексный вариант, оффлайн-программа + онлайн-сервис. Сейчас я расскажу, какие программы и сервисы для расшифровки аудиозаписей я знаю.
Транскрибация вручную
Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать «ручками». Точнее «ушками».
Это достаточно сложно. Точнее, технически-то, как раз ничего сложного нет. Берете аудиозапись, прослушиваете несколько секунд. Записываете. Возвращаетесь. Слушаете снова. Проверяете, все ли верно записали. И так следующий кусок. То есть, идея простая.
Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в «глухие телефончики»? 🙂 Вот такой же итог часто получается в случае «ручной транскрибации», когда «переводчик» пытается запомнить сразу много информации.
Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:
Короче, «кочек», на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию «вручную».
Заказ перевода аудио в текст у специалистов
Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.
Поэтому я нанимаю фрилансеров. Но.. И тут есть «засады»! Очень сложно найти «правильного» фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.
Сервис расшифровки аудиозаписей в текст Zapisano.org
Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…
Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который «заточен» под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.
Из «приятных плюшек» хочу отметить еще три, особо мне понравившихся.
Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.
Ну а тем, кто все-таки хочет самостоятельно освоить все тонкости расшифровки аудио в текст, нужно читать дальше
Субтитры Ютуб
Если Вам лень устанавливать какие-либо программы, а Вам нужно срочно провести транскрибацию аудиозаписи в текст, то… то просто воспользуйтесь Ютубом. Точнее субтитрами Ютуб. Как это сделать? Все просто.
Шаг 1. Залейте видео на свой канал Ютуб.
Шаг 2. Включите субтитры
Шаг 3. Нажать кнопку «Посмотреть расшифровку видео»
Шаг 4. Копируйте себе в блокнот полученный текст.
Шаг 5. Удалите метки времени и «причешите текст. Вот и все.
Субтитры Ютуб создает достаточно качественные. Единственное, много времени уходит на приведение текста в порядок. Но и в других программах, расстановка знаков препинания и приведение текста к нормальному виду тоже нужно делать. Так что…
Программа Express Scribe (Экспресс Скрайб)
Это наверное, одна из самых популярных программ для транскрибации
Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.
В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.
Express Scribe поддерживает все известные мне (и не известные 🙂 ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.
Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на приобретение Экспресс Скрайб.
Программа Lossplay
Вот еще одна программа для профессиональной расшифровки аудиофайлов. Программа ЛоссПлей. Это плеер от «нашего» разработчика. Поэтому удобен для русскоязычного транскрибатора.
Программа идеально подходит для новичка, который занимается расшифровкой аудио. В программе есть удобные быстрые клавиши.Этот плеер для транскрибации легко интегрируется с Word. Можно вставлять тайм-коды. Поддерживается огромное количество форматов аудиофайлов. Регулировка скорости воспроизведения. И многое-многое другое. Есть видеоуроки!
Сайт и программа Speechpad (Спичпэд)
Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.
Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!
Вообще, функционал сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:
Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.
И да, он тоже бесплатен! Во всяком случае, на момент написания данной статьи!
Онлайн-сервис dictation.io
Этот сервис для перевода аудио в текст не может подключать аудиофайлы или видеофайлы. Тут для транскрибации нужно проиграть аудиофайл на другом устройстве, и записать на микрофон в dictation.io.
Чем же хорош это сервис для перевода аудио в текст? Своей лаконичностью. Ничего лишнего! И, кстати, качество распознавания речи вполне себе на уровне! Удобно сохранять распознанный текст на компьютер. Сервис полностью бесплатный. Жалко только, что нельзя транскрибировать аудиофайлы
Сайт и программа RealSpeaker
Нужно знать, что сейчас оффлайн версии, то есть, программы для транскрибации ReaLSpeaker уже нет. Если Вы хотите пользоваться именно программой, то ищите старую версию.
Сейчас же можно работать только в режиме онлайн-сервиса.
Некоторым транскрибаторам эта программа (и сайт) очень нравится. Некоторым не очень. Я предлагаю Вам ответить на этот вопрос самостоятельно. Потестируйте немного ее, и узнаете.
В плюсы Реалспикера можно отнести то, что она работает с загруженными аудиофайлами. Есть много языков, которые RealSpeaker понимает. Из минусов — программа и сервис платные. Правда цена не очень высокая, но все-таки…
Программа Transcriber-pro
Еще одна офф-лайн профессиональная программа для расшифровки аудио и видео записей. С помощью Transcriber — pro Вы легко переведете аудио в текст!
Эта программа для транскрибации достаточно удобна. Есть горячие клавиши. Можно загружать аудио и видеофайлы и их заниматься переводом аудио в текст. Одна из «фишек» Транскрибера — Про — это командная работа над проектом. Единственное, эта программа не умеет распознавать речь. Это узкоспециализированный инструмент, предназначенный только для транскрибации!
Программа RSPlayer
Многие хвалят эту программу для профессиональной транскрибации.
Однако, сейчас официальный сайт этой программы не работает. Может в ближайшем будущем эта программа возродится вновь, но пока я сделать обзор на нее не могу. Если где-то найдете старую рабочую версию РСплеера, проверьте на вирусы. Рекомендую 🙂
Приложение Windows — VOCO
Эта программа распознавания речи профессионального уровня.
Основной функционал Windows-приложения перевода аудио в текст VOCO:
Короче, программа просто находка для профессионального транскрибатора! Но программа платная! Правда, есть демо-версия, в которой Вы можете ознакомиться с основным функционалом бесплатно. Правда, нужно подать заявку скачивание демо-версии Voco.
Программа Virtual Audio Cable
Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.
Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.
К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.
Гугл Документы
На последнем месте в списке стоят гугл документы. Но не на последнем месте по значимости. В гугл документах тоже есть голосовой ввод!
Кстати, этот голосовой ввод работает на удивление очень хорошо. Вы даже можете голосом расставлять знаки препинания. К сожалению, сюда нельзя подключить аудиофайлы для прямой транскрибации. Только «динамик-к-микрофону». Качество перевода аудио в текст при этом может пострадать. Зато Гугл Документы совершенно бесплатны!
Итого:
Теперь Вы знаете, какие есть программы для транскрибатора, то есть для перевода аудио в текст. Возможно, есть еще что-то, что я не знаю. Тогда напишите мне о них и я расскажу об этом!
И еще. Я не рассказывал про мобильные приложения для расшифровки аудиофайлов. Почему? Потому что, такие программы для смартфонов нужны в основном для записи своих мыслей простым людям, а также журналистам и писателям. профессиональные транскрибаторы мобильными программами практически не пользуются.
Специалист по интернет-рекламе
Бессонов Александр