Транскрибация
Содержание:
- Онлайн сервисы для набора текста голосом
- Где брать заказы на транскрибацию
- Программы для работы
- Программы для транскрибации
- Настройка виртуального кабеля
- Способ 3. Speechpad.ru
- «Gboard» — мобильное приложение преобразователь записи в текст
- Трудовые будни транскрибатора
- Программа Virtual Audio Cable
- Что такое транскрибация и как она выполняется
- Что приходится расшифровывать
- Программа «Laitis»
- Сколько можно зарабатывать
- Что нужно знать и уметь для заработка
- Google Документы
- Заключение
Онлайн сервисы для набора текста голосом
На данный момент есть очень большой выбор сервисов и программных приложений для голосового набора команд и управления.
Голосовой блокнот speechpad.ru
Преимущества:
Для использования онлайн версии следует перейти на сайт https://speechpad.ru/, пролистать страницу вниз, включить запись и получить готовый текст. Для браузера потребуется скачать и установить расширение.
Инструкция по использованию:
- Кликните по кнопке «Включить запись». (если Вы первый раз это делаете, то в правом верхнем углу возникнет всплывающее уведомление о том, что нужно разрешить доступ сервису к микрофону).
- Постарайтесь как можно четче и ближе к микрофону произносить слова. Стоит учитывать, что проговариваемый текст будет появляться там, где находится курсор. А если случайно перед этим был выделен текст, то он затрется.
- Можно активировать опцию «Отключить управление заглавными буквами» и тогда Google не будет обновлять регистр в зависимости от пунктуации. А для изменения необходимо будет воспользоваться кнопкой с текстом А/а, она увеличит или уменьшит размер той буквы рядом с курсором.
- Для удаления действия нужно нажать кнопку «Отменить».
- Для расстановки знаков препинания есть специальные кнопки на панели, активировать кликом левой кнопки мыши. Также Вы можете отметить для использования функцию «Заменять слова пунктуации» и тогда сможете голосом расставлять знаки препинания.
- Для того, чтобы поменять язык, необходимо нажать на данное поле и появится выпадающий список, в котором следует найти и выбрать требуемый. При условии, что нет нужного, необходимо зарегистрироваться и добавить в личном кабинете.
- Чтобы давать команды сервису при помощи голоса, активируйте пункт «Выполнять команды».
- Также вывод текста можно делать не только в поле на сайте сервиса, но и в буфер обмена после выбора использования такой функции на странице и установке расширения для блокнота.
Голосовой ввод текста в Гугл документах
Преимущества и возможности:
- Запись, редактирование и форматирование информации голосом.
- Удобство: нет необходимости устанавливать программу на устройство.
- Мультиязычность.
Пошаговая инструкция применения:
- Перейти в браузере в раздел «Инструменты».
- Откройте из предложенных пунктов «Голосовой ввод».
- Активируйте кликом иконку микрофона (разрешите использование).
- Начинайте громко и четко произносить то, что следует записать.
Расширение для браузера Войснот II
Достоинства:
- Удобство.
- Интуитивно понятный интерфейс: достаточно простое управление.
- Есть возможность создать ярлык для быстрого доступа к сервису.
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
- Сохранение информации в браузере, кэше, буфере обмена.
Инструкция использования:
- Установка:
- Перейти в магазин расширений Google: http://goo.gl/oMx8Xx;
- Установить и разрешить использование микрофона.
- Создание ярлыка на рабочем столе:
- Перейти на страницу расширений, которые установлены.
- Нажать на иконку Войснот.
- Выбрать в появившемся меню «Создать ярлык».
- Запуск/остановка:
- Нажать на кнопку с изображением микрофона.
- Или активировать сочетание клавиш Ctrl+Пробел.
- Запись текста предполагает расставление знаков препинания с учетом правил русского языка и пауз в процессе диктовки.
- Чтобы отредактировать, следует воспользоваться панелью инструментов: стереть, сохранить, скопировать, исправить регистр букв, добавить недостающие знаки пунктуации, перейти на новую строку.
Распознавание речи в браузере TalkTyper
Преимущества:
- Бесплатный сервис;
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
Инструкция:
Голосовой блокнот August4u
Достоинства:
- Простота использования.
- Является уникальной разработкой.
- Высокий уровень качества и скорости распознавания.
- Использовать можно бесплатно.
Инструкция:
- Перейти на страницу сервиса: https://august4u.net/?speech2text.
- Можно выбрать один из 6 языков.
- Нажать на иконку микрофона и разрешить доступ к устройству.
- Автоматически включена расстановка знаков препинания, но нажав на кнопку с текстом «.,!» можно отключить данную функцию.
- По окончании диктовки можно сохранить, копировать, отправить на электронную почту полученный текст и очистить поле, нажав на иконку с крестиком.
Где брать заказы на транскрибацию
Вечная головная боль — где брать заказы? Я для вас подобрал несколько лучших сайтов, где можно искать заказчиков и предлагать свои услуги по переводу содержания из аудио в текст.
Work-Zilla
Основная масса заказчиков находится именно здесь и начинать лучше всего отсюда. Здесь много как мелких заказов в 100 рублей, так и больших на несколько тысяч
Новичкам я советую идти сначала сюда. За счет небольших заказов можно быстро набрать репутацию и выйти на достойный заработок в день.
Kwork
На сегодня это самая успешная биржа фриланс-услуг с фиксированный оплатой. Каждый куворк здесь стоит 500 рублей. Здесь вы уже не ищете заказчиков, а заказчик ищет исполнителей. Вот пример одного из исполнителей.
Данная исполнительница на сайте меньше года, а уже выполнила 104 задания. Конечно же у нее не все задания были по транскрибации, но все они связаны с набором текста. И конечно же она работает не только на kwork, но и на других сайтах по заработку. Это к вопросу, а можно ли на этом заработать. Как видите, да!
ToDo (биржа закрылась)
Почти брат-близнец сайта Kwork, за небольшим отличием. Здесь исполнители могут назначать цену за свои услуги и не ограничены в цене одного ворка. Можно создать ворк на 100 рублей за 10 минут, а можно и 1200 за час. Никто вас не ограничивает. По популярности уступает Kwork’у.
MoguZa
МогуЗа позиционирует себя как продавец цифровых услуг, где исполнители предлагают свои услуги за конкретную сумму. На сегодняшний день на сайте 108 предложений о переводе аудио в текст, вы можете стать 109-м.
YouDo.com
Юду — один из крупнейших сервисов в интернете по поиску исполнителей. В отличии от описанных выше конкурентов, он специализируется на всех сферах жизни, а не только на интернете. Здесь можно найти от уборщика туалетов, до конструктора космических короблей.
Есть в нем и сегмент для интернет работы Перейдите на freelance.yodo.com и вам будет доступна фриланс биржа, где и можно найти заказчиков по трансрибации.
Weblancer
Одна из популярнейших фриланс-бирж рунета. Здесь можно найти как разовые заказы, так и постоянную работу.
Увы, заказов здесь не так много.
FL.RU
Самая популярная фриланс биржа. Заказов здесь много, но идти сюда стоит уверенным в своих силах и с деньгами в кармане, точнее купленном PRO-аккаунтом. Да, по транскрибации здесь дают заказчики только исполнителям с платным аккаунтом.
Advego
Не лишним будет вам зарегистрироваться на бирже контента — Advego. Здесь может и не так часто, но все же, проскакивают интересные заказы по расшифровки аудио и видео в текст. А если активных заданий нет, то можно заработать и другими способами, коих здесь огромное множество (копирайт, рерайт, лайки, репосты, комментирование, создание тем на форуме и др.)
АудиоБюро
Если вы хотите найти постоянную работу с гарантированной заработной платой, то можете попробовать свои силы в «Аудио Бюро», специализирующихся на предоставления услуг в сфере аудио и видео услуг. В разделе «Вакансии» можно найти предложения трудоустройства в качестве расшифровщик аудиозаписей и некоторых других.
Эти сайты, которые я бы рекомендовал для старта заработка на транскрибации. Это конечно же не полный список, но здесь больше всего заказчиков и меньше шанс наткнуться на мошенников и обман. Многие исполнители открывают свои сайты и зарабатывают на них услугами по переводу содержимого аудиофайлов в текст. Ну или предлагают свои услуги через социальные сети.
Первое время вам потребуется поработать на свои:
- Имя
- Репутацию
- Портфолио
Дальше они уже будут работать на вас, и заказчики сами будут к вам обращаться.
Программы для работы
Выбирайте программы с поддержкой большинства известных типов аудио- и видеофайлов. Заказчик может отправить материал в любом формате.
Еще одна важная функция — эквалайзер, который подавляет фоновый шум и выделяет голоса. Также значительно облегчает работу в программе возможность настроить горячие клавиши.
Есть автоматическая транскрибация, которая проводится с помощью онлайн-сервисов распознавания голоса. Но у таких программ много минусов. Они могут не разобрать быструю и нечеткую речь. А готовый текст придется долго структурировать и исправлять ошибки.
Голосовой блокнот Speechpad
Программа совместима с любой операционной системой, но работает только в браузере Chrome. Дополнительно разработчики выпустили приложения для Android и iOS.
Программа распознает и печатает слова человека, говорящего в микрофон, переводит видео- и аудиодорожки в текстовый документ.
Также Speechpad делает перевод с html5 и Youtube (вставляете ссылку или ID записи и нажимаете кнопку «Включить»).
Голосовой блокнот предлагает базовый и премиум-пакет с дополнительными услугами. Их можно получить после регистрации личного кабинета и внесения оплаты.
К расширенными функциям относят возможность загрузки одновременно нескольких файлов для транскрибации, отключение рекламы, счетчик слов, поддержка Bluetooth.
В программе можно включить запись и одновременно проговаривать текст в микрофон. Эту функцию используют при тихом и неразборчивом разговоре. Но требуется качественное и чувствительное оборудование, иначе блокнот воспроизведет речь неточно.
Программа Express Scribe
Express Scribe бывает бесплатной и платной. В первом случае не получится транскрибировать видеофайл. Сначала нужно извлечь звуковую дорожку.
Но программа только условно бесплатная. Через 3 дня она потребует заплатить за дальнейшее пользование. Проблема решается удалением и повторной инсталляцией.
Интерфейс на английском языке, но интуитивно понятный.
Express Scribe справляется даже с тихой и неразборчивой речью за счет функции улучшения качества звучания. Можно уменьшить фоновые помехи, отфильтровать высокие частоты, усилить громкость голоса.
Express Scribe назначает горячие клавиши, поддерживает большинство известных форматов аудио и видео. А также проигрывает запись с различной скоростью и сворачивается в режим миниатюры. Еще один плюс — поддержка модулей для транскрибирования.
Express Scribe не набирает текст автоматически и не работает с файлами из интернета. Также не получится восстановить набранный текст, если нечаянно удалить его.
Плеер LossPlay
Мультиязычный плеер LossPlay разработан для ручной транскрибации файлов и прослушивания музыки. Программа адаптирована для работы с «Ворд» и умеет воспроизводить аудио нажатием горячих клавиш без переключения между окнами. Такая функция экономит время.
Преимущество плеера — способность вставить тайм-код при нажатии горячей клавиши.
Плеер поддерживает все известные форматы, имеет 4 активных плейлиста, умеет регулировать скорость воспроизведения и баланс звука, делать закладки. А еще можно изменить цвет оболочки программы и сделать скриншот.
LossPlay поддерживает работу с компьютерными педалями. Они заменяют горячие клавиши клавиатуры. Одним нажатием можно перемотать аудиозапись вперед или назад, включить или поставить на паузу.
С классическим интерфейсом LossPlay разберется даже новичок. Он похож на медиаплеер Winamp. Чтобы начать работу, нужно загрузить файл или вставить ссылку на сайт.
Программы для транскрибации
Существует много специальных сервисов, которые позволяют облегчить работу. Сервис dictation.io считается прекрасным вариантом, который дает возможность бесплатно перевести речь в текстовый формат.
Площадка обеспечивает автоматическое сохранение готовых результатов. Это поможет избежать случайного удаления вследствие закрытия вкладки или браузера. Сервис не позволяет распознать готовые файлы. Он работает с микрофоном. При диктовке следует называть знаки препинания.
Текст удается распознать достаточно корректно, без орфографических ошибок. Также можно самостоятельно вставлять с клавиатуры знаки препинания. Сохранить готовые результаты можно на своем компьютере.
Сайт speechpad.ru представляет собой онлайн-площадку, которая позволяет через браузер Google Chrome переводить речь в текстовый формат.
Сервис работает с готовыми файлами и микрофоном. Безусловно, качество будет выше при использовании внешнего микрофона. Однако сайт неплохо трансформирует даже ролики на YouTube.
При этом нужно нажать «Включить запись», ответить на вопрос относительно использования микрофона. А затем следует нажать «Разрешить».
Готовый результат удается легко отредактировать. Для этого требуется ручным способом исправить выделенное слово или надиктовать его снова. Результаты можно сохранить в личном кабинете или скачать на компьютер.
Сервис позволяет работать с 7 языками. При этом он имеет и недостаток. Если требуется транскрибация готового аудиофайла, он звучит в колонках. Это становится причиной дополнительных помех в виде эха.
Dragon Dictation представляет собой бесплатное приложение, которое подходит для устройств компании Apple. Программа дает возможность редактировать результаты, выбирая нужные слова из списка
При этом важно четко проговаривать все звуки, без пауз. Нежелательной является и интонация
Иногда можно столкнуться с ошибками в конце слова.
Существует много программ, которые облегчают работу
Приложение Dragon Dictation подойдет и для обладателей гаджетов Android. Они могут диктовать в него список покупок или другую важную информацию.
Следующим полезным сайтом станет RealSpeaker. Эта программа с легкостью переводит речь человека в текстовый формат. Она позволяет преобразовывать речь, которая звучит в микрофон. Он может быть встроен в ноутбук. Также удается преобразовывать формат, записанный в аудиофайлы.
Программа преобразовывает 13 языков мира. Существует бета-версия, которая функционирует как онлайн-сервис. Для этого необходимо выбрать русский язык, загрузить на сайт файл. При этом за его перевод приходится платить. После этого можно скопировать готовый текст. Чем больше размер файла, тем больше времени уйдет на преобразование.
Speechnotes считается альтернативой RealSpeaker, которая позволяет работать на Android. Текст удается редактировать автоматически и расставлять в нем знаки препинания. Этот вариант удобен для составления список или заметок. В результате удается получить качественный текст. Также существует платная премиум-версия.
Настройка виртуального кабеля
1. Скачиваете виртуальный кабель, распаковываете его в папку и запускаете либо VBCABLE_Setup.exe, либо VBCABLE_Setup_x64.exe (в зависимости от разрядности вашей Windows)
2. Открываете окно управления записывающими устройствами и делаете CABLE Output устройством по умолчанию.
3. Открываете окно управления устройствами воспроизведения и делаете CABLE Input устройством по умолчанию.
4. Теперь можно приступать к транскрибированию. После этих манипуляций звук будет идти из выхода аудио на запись, микрофон при этом перестает работать. Чтобы вернуть его для работы нужно сделанные исменения откатить (вернуть все назад).
Способ 3. Speechpad.ru
Это онлайн блокнот, позволяющий переводить речь в текст. Работать можно как с регистрацией, так и без. Зарегистрированные пользователи могут сохранять сформированные тексты в упорядоченном виде, настраивать интерфейс блокнота, использовать голосовые команды. Приятно, что разработчики записали подробную инструкцию по голосовому вводу текста, которая находится прямо на главной странице сайта:
А с помощью кнопки «Транскрибация» можно записать текст с аудио, видеофайлов или с Youtube-хостинга.
Плюсы блокнота:
- работа и с микрофоном, и с медиа файлами
- набор текста происходит синхронно диктовке, поэтому правки в текст можно вносить сразу
- сохранение готового текста в файл
Минус пользователи отметили лишь один, и он несущественный — корректно блокнот работает только в браузере Google Chrome.
Рассмотрим транскрибацию видеоролика с Youtube.
Шаг 1. В строке поиска вводим speechpad.ru и попадаем на главную страницу блокнота.
Шаг 2. Прокрутив страницу до конца, нажимаем кнопку «+Транскрибацию».
Шаг 3. В открывшейся панели транскрибации отмечаем медиа тип «Youtube video»
Шаг 4. В поле «ID файла для проигрывания» вносим ID того ролика, который хотим транскрибировать.
ID ролика находится в адресной строке Youtube после знака «=».
Нажимаем кнопку «Обновить».
Шаг 5. Включаем воспроизведение видео и нажимаем кнопку «Включить запись»
Шаг 6. Проверяем текст, исправляем ошибки. Кнопка «Скачать» позволяет сохранить результат в формате текстового документа.
«Gboard» — мобильное приложение преобразователь записи в текст
Мобильное приложение «Gboard» является популярным приложением для Android и iOS, позволяя осуществлять длительный голосовой ввод с дальнейшей трансформацией сказанного в стандартный текст (конвертация голоса в текст). Для задействования режима голосового ввода достаточно нажать и удерживать сенсорную клавишу пробела (Space) на клавиатуре, после чего вы сможете говорить так долго как захотите — всё сказанное вами будет переведено программой в текст.
Для активации голосового ввода в «Gboard» достаточно нажать и удерживать пробел
Приложение абсолютно бесплатно, поддерживает несколько десятков языков, среди которых и русский.
Трудовые будни транскрибатора
Транскрибация – это перевод аудио или видеозаписи в текстовый документ. Транскрибатор надевает наушники, воспроизводит файл с помощью специального проигрывателя и перепечатывает услышанное в Word.
Плохое качество записи
Не всегда аудио записывают с помощью профессиональной техники или обычного диктофона. Иногда используют программку на дешёвом мобильнике. При прослушивании голос говорящего кажется тихим, присутствуют посторонние звуки, шум. Порой один и то же фрагмент приходится переслушивать по 3-5 раз, чтобы понять суть разговора.
Наличие нескольких говорящих
В большинстве случаев исполнителю приходится транскрибировать диалоги двух, трёх и более лиц. Часто говорящие перебивают или даже перекрикивают друг друга. А ведь в итоговом документе отражаются понятные и последовательные диалоги.
Присутствие в записи неизвестных терминов и словечек
Транскрибатор должен знать хотя бы крылатые фразы, экономические и юридические термины. Многие исполнители даже ленятся пользоваться Google во время работы. Буквально пишут то, что услышали (например, «сволочем-билетом», и не «с волчьим билетом»).
Рутинный характер работы
Труд транскрибатора монотонный, нудный и напряжённый. Приходится часами делать одно и то же: слушать и печатать, слушать и печатать.
Таким образом, хорошим транскрибатором станет человек, который обладает следующими навыками и личностными качествами:
- высокой скоростью печати;
- хорошим слухом;
- эрудицией;
- внимательностью;
- усидчивостью;
- ответственностью.
Сколько времени занимает перед аудио или видео в текст? Зависит от качества записи, количества говорящих, требований заказчика к оформлению. В любом случае умножайте время на «3». Например, на расшифровку аудио продолжительностью 60 минут вам понадобится не менее 3 часов.
Программа Virtual Audio Cable
Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.
Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.
К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.
Что такое транскрибация и как она выполняется
Процесс транскрибации подразумевает под собой восприятие аудиоконтента и его последующее преобразование в текст. Причем необходимо преобразование слово в слово.
Эта методика используется в профессиональной деятельности, например, когда нужно подготовить отчет о прошедшей встрече, интервью или онлайн-конференции в Zoom в текстовом виде, если необходимы субтитры к лекции для более удобного восприятия или же при адаптации материалов для людей с нарушениями слуха.
Раньше для упрощения этой процедуры готовили специалистов-стенографов, которые с помощью особых методик сокращения текста могли, не отставая от говорящего, перевести в текст каждое его слово. Сейчас же этим чаще занимаются не в реальном времени, а в записи, и на помощь приходит продвинутое программное обеспечение. Отсюда и новая профессия – расшифровщик, транскрибатор или транскрайбер, как вам угодно. Но о ней поговорим позже.
Автоматическая транскрибация
Почти любое мобильное устройство или компьютер позволяет автоматизировать транскрибацию. Можно просто включить диктовку на Айфоне, и гаджет трансформирует всю услышанную речь в буквы. Крупные корпорации в духе Google и Яндекс задействуют нейросети, чтобы анализировать речь людей в аудио- или видеофайлах и превращать их в текст.
Проблема такого метода в том, что без продвинутого ИИ не получится соблюсти правила грамматики и четко разграничить речь двух, трех и более людей. Поэтому автоматизировать процесс полностью куда сложнее, и для этого обычной телефонной «диктовки» не хватит. Понадобится более продвинутое и платное ПО, но и оно может не справиться, если исходная запись имеет плохое качество с тяжело распознаваемой речью.
Ручная расшифровка
Это та, в которой задействован человек. Сидит сотрудник, обученный для работы с устной речью, и превращает ее в текст, прослушивая записи различного качества.
Человек нужен в большинстве случаев, так как работать чаще приходится с записями низкого качества. Компьютер ошибается при попытке правильно распознать искаженную артефактами речь. А человек, ввиду более абстрактного мышления, может додумать фразу из контекста или попросту нормально расслышать то, что не может расслышать ИИ.
Транскрибаторы получают за свой труд оплату. Это отдельная профессия, пользующаяся спросом в интернете среди тех, кто хочет зарабатывать, не покидая квартиры. То есть для начинающих фрилансеров.
Что приходится расшифровывать
Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.
Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.
Вид транскрибации
Уровень сложности
Характеристика
Надиктовка
* тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**
тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**
тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**
тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**
тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и выше
тайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» — бальзам на транскрибаторскую душу.
Простой вебинар
**
тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше
тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше
тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше
тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку
Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
*****
тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
*****
тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего
При этом качество звучания, как правило, оставляет желать лучшего.
Вид транскрибации |
Уровень сложности |
Характеристика |
Субтитры |
** тайм-код обязательно |
Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики. |
Простой монтажный лист |
*** |
Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды. |
Полный монтажный лист |
***** |
Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре. |
Программа «Laitis»
Бесплатная русскоязычная программа для распознавания голоса «Laitis» обладает хорошим качеством понимания речи, и, по мнению её создателей, способна практически полностью заменить пользователю привычную клавиатуру. Программа хорошо работает и с голосовыми командами, позволяя с их помощью выполнять множество действий по управлению компьютером.
Для своей работы программа требует обязательного наличия на ПК скоростного интернета (в работе программы используются сетевые сервисы распознавания голоса от «Google» и «Yandex»). Возможности программы позволяют, также, управлять с помощью голосовых команд и вашим браузером, для чего необходима установка на веб-навигатор специального расширения от «Laitis» (Chrome, Mozilla, Opera).
Сколько можно зарабатывать
Начальная ставка за транскрибацию колеблется в пределах 8-10 руб. за минуту. Более опытные фрилансеры просят за работу 15-20 рублей. К примеру, транскрибация часового интервью будет стоить 1500-1900 рублей.
На конечную стоимость может повлиять:
- Качество материалов для транскрибации, сколько человек участвует в диалоге, требуется ли дополнительная обработка и т.п.
- За срочность также доплачивают. Например, при небольшом дедлайне могут платить 50 рублей за минуту и больше.
- Аудиозаписи, сделанные на судебных заседаниях оцениваются в 50 рублей за минуту и выше.
- За транскрибацию с английского языка получают 60-70 руб. / мин. С других языков может быть дороже.
При неплотном графике работы на транскрибации можно зарабатывать от 15 до 25 тысяч рублей в месяц. При полном рабочем дне, пять дней в неделю сумма месячного заработка может составить 30 – 40 тысяч рублей и выше.
Необходимо знать, что набор текста занимает в три раза больше времени, чем длительность самой записи. При низком качестве записи требуется обработка звука. Такая работа может занимать около 5-6 часов на один час аудио- или видео- файла.
Что нужно знать и уметь для заработка
Чтобы осуществлять заработок на транскрибации, нужно:
- писать грамотно и без ошибок, соблюдать все орфографические и стилистические правила;
- уметь правильно оформлять текст;
- обладать усидчивостью;
- натренировать специальный вид внимания.
Записи могут быть нечеткими, плохо различимыми, но транскрибер должен уметь во всем ориентироваться и отделять реплики друг от друга. Транскрипция текста должна иметь ясное содержание с правильной идентификацией спикеров.
В ходе работы мастер может затранскрибировать некоторые непонятные термины. Данные слова следует подвергать дополнительной проверке, чтобы недопустить ошибок.
Для работы на профессиональном уровне желательно иметь качественную гарнитуру.
Для удобства транскрибации существует специальное программное обеспечение по обработке аудиофайлов, с помощью которого можно ускорять или замедлять воспроизведение, убирать шумовые эффекты и т.д. Такие программы ценятся транскрибаторами, потому что помогают облегчить их труд и сократить время работы. Ниже будут рассмотрены некоторые из них.
Кому это подойдет
Если вы хотите почувствовать себя фрилансером и попробовать транскрибацию в качестве заработка, то для успешного старта вам понадобится следующее:
- От шести часов свободного времени в день.
- Наличие устойчивого интернет-соединения (чтобы не зависало видео).
- Хорошее знание русского языка.
- Усидчивость и работоспособность.
- Обязательно, чтобы был ноутбук или компьютер, а не телефон.
Вам также может быть интересно: Копирайтер — кто это и где работает
Google Документы
В облачное хранилище Google Диск встроен сервис Google Docs, в котором можно переводить аудио данные в текст. Этот способ работает в браузере Google Chrome, и в других браузерах, основанных на Chromium.
Пройдите несколько шагов:
- Войдите в Google Диск (Google Drive).
- Нажмите на кнопку «Создать».
- В контекстном меню выберите сначала «Google Документы», а затем «Создать новый документ».
- В окне «Новый документ» откройте меню «Инструменты», нажмите на пункт «Голосовой ввод» (вызывается сочетанием клавиш «Ctrl» + «Shift» + «S»).
- Нажмите на кнопку с изображением микрофона, а затем начните говорить.
- Произносимая в микрофон речь переводится в текст, который вводится на страницу документа.
- Сохраните документ в облачном хранилище, или скачайте файл на компьютер в одном из поддерживаемых текстовых форматов.
В Гугл Документах нет ограничения на количество вводимых символов.
Для извлечения текста из видео или аудио файлов в интернете, потребуется включить голосовой ввод, а затем запустить воспроизведение нужного файла в другой вкладке браузера.
Если вам нужно перевести голос в текст из видео или аудио файла, находящегося на компьютере, сделайте следующее:
- В окне Документы Google включите голосовой ввод.
- Включите воспроизведение видео или аудио файла в плеере на ПК.
- В документе появится текст из проигрываемого локального видео или аудио файла.
Заключение
Транскрибация контента — отличный способ освободиться от необходимости делать заметки во время встречи, беседы, лекции. Вместо этого вы можете сосредоточиться на прослушивании и взаимодействии с другими участниками или в случае личных голосовых заметок, слушайте себя вслух, размышляйте и свободно стройте свои собственные идеи. И с помощью простых в использовании инструментов, доступных сегодня, можно быстро и легко выполнять свои задачи делая транскрипции.
Ресурсы: иконка микрофона Travis Yunis из проекта Noun Project; Иконка Paper-Shredder от Maximilian Becker из проекта Noun Project.