Меню Рубрики

Dragon dictate на русском распознавание речи для windows 7

Пять способов как превратить голос в текст

Кто не мечтал отдать компьютеру диктофонную запись и через некоторое время получить готовый текст? Сегодня мы расскажем, как это сделать.

Способ первый: по старинке
Садимся за компьютер, одеваем наушники, включаем диктофонную запись. И начинаем расшифровывать, быстро-быстро стуча по клавишам. На сегодня это самый надежный способ. И самый медленный. Если собеседник говорит быстро или плохое качество записи, вам придется не раз перематывать диктофонную запись назад. В среднем вам придется потратить в два-три раза больше времени, чем длится запись, которую вы расшифровываете.

Совет: для прослушивания записи используйте аудиоплеер AIMP. В нем можно замедлить скорость воспроизведения через Менеджер звуковых эффектов. Голос при этом будет искажен, зато вам реже понадобится перемотка назад. Если же запись очень тихая и максимальная громкость не помогает, можно воспользоваться нормализацией записи (специальный способ увеличения громкости).

Способ второй: начитываем сами
Современные технологии распознавания речи продвинулись далеко. Но они еще не справляются с диктофонными записями, где присутствуют посторонние шумы, собеседника слышно тихо или плохо. Зато они хорошо распознают голос с микрофона. Воспользуемся этим.

Устанавливаем Яндекс.Диск 3.0 , вместо с ним установится утилита Заметки в Яндекс.Диске. Открываем ее и нажимаем на значок микрофона. Скажите несколько фраз. Текст распознается почти без ошибок. Из знаков препинания здесь только точки. Но и этого достаточно.

Теперь запускайте диктофонную запись в наушниках и одновременно начитывайте ее своим голосом в микрофон (можно использовать встроенный в наушники). Так вы получите вполне сносный к дальнейшей обработке текст. Разумеется, вы должны уметь быстро воспринимать чужую речь и превращать ее в свою.

Совет: можете также использовать другие сервисы, базирующиеся на разработках Google — GoogleSpeech , Speechpad или Speechlogger . Эти сайты нужно запускать в браузере Google Chrome.

Способ третий: грузим YouTube
Ютуб умеет автоматически создавать субтитры. Вы можете попробовать загрузить в сервис диктофонную запись и подождать, пока сформируются субтитры (т.е. распознается ваш текст). Процесс долгий и каким будет результат, вы узнаете не сразу. Поэтому этот способ мы не рекомендуем. Из плохой записи вы все равно не получите приличный результат.

Способ четвертый: полная автоматика
Если у вас хорошая диктофонная запись, где голос звучит ровно, ясно и четко, нет посторонних шумов, можно попробовать использовать вышеупомянутые программы распознавания речи. Но вначале схитрим: сделаем так , чтобы аудиозапись, воспроизводимая с компьютера, была автоматическая направлена на микрофон.

Для этого нам нужно зайти в настройки Windows. В панели Звуки заходим во вкладку Запись , где отключаем Микрофон и другие входы и включаем Стерео микшер . Если вы не видите этих устройств, попробуйте включить показ отключенных и отсоединенных устройств.

После этого включаем сервис рапознавания речи (например, от Яндекса) и включаем воспроизведение диктофонной записи. Практически сразу же начнется распознавание и перевод голоса в текст. В наушниках аудиозапись вы слышать не будете. Не переживайте, так и должно быть.

Если не получается, нужно скачать и установить виртуальное устройство VB-CABLE Virtual Audio Device ( скачать драйвер можно здесь ). Теперь в панели Звуки включаем CABLE Input и CABLE Output (в вкладках Воспроизведение и Запись) и отключаем все остальные включенные устройства.

Учтите, хороший результат вы можете получить только с качественной аудиозаписью. Вот что может получится с плохой — смотрите на скриншоте. Если что «масик мама» — это «массив маймо» (Massive MIMO).

Способ пятый: дождаться будущего
Пройдет еще несколько лет и проблема расшифровки аудиозаписей исчезнет. Искусственный интеллект научится отделять зерна от плевел (т.е. голос от шума), улучшится распознавание плохой речи. Надо только подождать.

Источник

Приложения Dragon — новый стандарт распознавания голоса

Мировым лидером в области распознавания голоса является компания Google. В последнее время можно видеть рекламу голосового поиска Google, в которой демонстрируется работа сервиса на смартфоне под управлением Android. Но Google не забыла и о iOS под которую выпустила соответствующее приложение. Правда приобрести его можно только в американском iTunes Store и распознавать она сможет только английскую речь. Поэтому я хочу вам рассказать о двух приложениях, в основу которых заложен один принцип работы и которые без проблем работают с русской речью и готовы выслушать, и что более важно, преобразить в текст все ваши личные сообщения, статусы в социальных сетях и поисковые запросы. Имя этим приложениям Dragon Dictation и Dragon Search.

Dragon Dictation и Dragon Search — это разработка компании Nuance, которая уже не первый год присутствует на этом рынке. Но вот до русского языка разработчикам удалось добраться лишь сейчас. Россия стала 21 страной, чей язык полностью поддерживается приложениями Dragon.

Итак, начну с приятного — оба приложения абсолютно бесплатны и работают на всех iOS устройствах с версией выше iOS 4, за исключением первого поколения iPod Touch. Что же из себя представляет эти, на первый взгляд, загадочные приложения? А ничего загадочного в них нет. Принцип их работы предельно прост. Если вам понадобилось ответить на сообщение, но возможности набирать текст вручную нет, то вам хватит и пары тапок по экрану устройства, чтобы записать и отправить ответ. Тапаем по иконке Dragon Dictation, затем по кнопке записи, произносим любой текст на русском языке и после обработки, которая занимает не более двух секунд видим перед собой текст произносимый нами несколько мгновений назад. Все в точности так, как вы и сказали. Прямо в приложении вы можете скопировать скомпилированный текст и вставить его в любое другое приложение.

Такие чудеса происходят благодаря технологии NaturallySpeaking и наличию обширной базы голосовых данных на русском языке, общая продолжительность устной речи в которых составляет более 200000 часов. Внушительная цифра, скажу я вам. Согласно замерам, проводимым компанией Nuance, процесс набора текста устно ускоряется до пяти раз.

Первое приложение Dragon Dictation позволит вам отправить текст в Twitter или Facebook, послать в сообщении или скопировать в буфер обмена для последующей вставки в любое другое приложение. Dragon Search представляет из себя полноценный поисковик, рассчитанный на сразу несколько поисковых систем. Надиктованная приложению речь моментально преобразуется в текст. Затем отправляется запрос на один из предустановленных поисковиков. Ими могут быть Google, Яндекс Wikipedia, YouTube или iTunes Store. Так или иначе поиск выдаст все варианты по продиктованному вами запросу так, как если бы вы спрашивали это напрямую.

Все эти плюшки приятны, но основным преимуществом приложений остается их высокая разборчивость слов, обширная база русскоязычных голосовых данных, которая позволит пользователю находить общий язык с программой буквально с первого произнесенного человеком звука. Поскольку тема актуальности языка в такого рода приложениях крайне важна, не могу не обратить внимания на то, что приоритетный язык будет изменяться вместе с изменением языка основного пользовательского интерфейса. Если до того, как вы изменили язык системы на английский с русского программа разговаривала с вами по-русски и все прекрасно понимала, то теперь она буде only англоговорящей и англовоспринимающей. Для изменения языка программы вам понадобится обратиться к настройкам, в которых вы сможете выставить интересующий вас язык интерфейса.

Для ускорения публикации новых статусов в Twitter и Facebook в Dragon Dictation имеется возможность связывания приложения с этими сервисами. Просто войдите в свой аккаунт из под Dragon Dictation и все последующие публикации будут отправлять на сервиcы с пометкой «via Dragon Dictation»

Отличительной особенностью обоих приложений является сохранение запросов. История запросов хранит каждое ваше обращение к приложениям. При необходимости удалить историю вы сможете через меню настроек.

Главным недостатком обоих приложений является отсутствие поддержки многозадачности в iOS 4. К счастью, это единственный недостаток, который был найден в процессе эксплуатации приложений. В остальном же никаких вопросов после использования не остается. Будем надеяться, что поддержка многозадачности появится в приложениях в одном из ближайших обновлений. В любом случае, хотим пожелать успехов компании Nuance на новом для нее российском рынке голосового поиска.

Название: Dragon Dictation и Dragon Search
Издатель/разработчик: Nuance Communications
Цена: free
Ссылка на Dragon Dictation: iPhone
Ссылка на Dragon Search: iPhone

Источник

Dragon Dictation для iOS превращает устную речь в печатное слово

Если верить английскому писателю и футурологу Артуру Кларку, любая достаточно развитая технология неотличима от магии.

Есть несколько разработок, которые для меня, простого обывателя, выглядят как волшебство. Прежде всего, это видеозвонки (и не важно, Skype это или FaceTime — оба приложения восхищают одинаково), распознавание лиц в iPhoto, поиск по тексту, который содержится на фотографиях и картинках (это я про Evernote). Вчера список пополнился новым приложением — Dragon Dictation.

Dragon Dictation — это программа, которая превращает устную речь в письменный текст. Проще говоря, вы надиктовываете приложению несколько фраз, а оно превращает их в печатное слово.


Программа попросит разрешения использовать имена ваших контактов из адресной книги для более точного распознавания

Dragon Dictation — не новая разработка, программа выпускается давно, успела завоевать кучу наград. Но только вчера разработчики сообщили о полной поддержке русского языка. На великом и могучем можно продиктовать сообщения, «Дракон» переведет их в обычный текст и предложит отправить по SMS, электронной почте или в Твиттер.

По достоинству Dragon Dictation оценят те владельцы iPhone, кто ненавидит набирать СМС. Как бы хороша не была клавиатура телефона Apple, набор текста по-прежнему требует слишком много времени. С DD вам остается произнести пару фраз и отправить сообщение по SMS.

Русский язык — очень непростой. Реализовать распознавание речи сложно. И Dragon Dictation, разумеется, неидеален. Программа может неправильно понять произнесенные вами слова. Практически совсем не распознает тон, поэтому не может определить, прозвучало утверждение или вопрос (в английском с этим гораздо проще; там для вопросов и утверждение предусмотрен особый порядок слов). Однако в любом случае, это точно одно из лучших решений, среди тех, что доступны сейчас рядовому юзеру. Точность работы по моим субъективных оценкам даже лучше, чем голосовой поиск Google.


Текст можно отредактировать, а также отправить по email, SMS, в Twitter и Facebook

Dragon Dictation — бесплатное приложение. Если не любите набирать текст, используя клавиатуру iPhone, советую попробовать эту программу. У меня она теперь будет размещена на первом экране.

Скачать в App Store: Dragon Dictation
Разработчик: Nuance Communications
Цена: бесплатно
Системные требования: iOS 4.0 и выше

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Dpc watchdog violation windows 10 ошибка как исправить
  • Dpc watchdog violation windows 10 как исправить видео на русском
  • Downloading windows xp compatible installer вылезает и сразу пропадает
  • Downgrade windows server 2012 r2 to windows server 2012 r2
  • Downgrade windows server 2012 r2 to windows server 2008 r2