Яндекс выпустил приложение Яндекс.Диктовка для голосового набора и редактирования текста
Компания Яндекс выпустила экспериментальное приложение под названием Яндекс.Диктовка, созданное на базе речевых технологий Yandex SpeechKit.
Как сообщают разработчики, приложение Яндекс.Диктовка предназначено для набора текста голосом. Чтобы начать набор, достаточно произнести фразу «Яндекс, записывай». Приложение начнет слушать пользователя и преобразовывать его речь в текст в режиме реального времени.
Редактировать текст тоже можно голосом. Вы можете сказать, например, «Удали последнее слово», «Начни с новой строки», «Выдели весь текст», «Добавь веселый смайлик» — и Яндекс.Диктовка выполнит ваше пожелание. По команде «Прочитай всё» приложение озвучит текст, который вы надиктовали. Готовый текст можно сохранить как заметку, отправить в виде письма или СМС. Все это тоже можно сделать голосом.
Приложение Яндекс.Диктовка уже доступно в магазине приложений Яндекса и, по словам разработчиков, позже оно появится в магазинах Google Play и App Store.
Как поясняют разработчики, приложение Яндекс.Диктовка выпущено для того, чтобы показать новые возможности Yandex SpeechKit — разработанной Яндексом собственной системы распознавания речи. Она используется как в сервисах Яндекса — например, в Яндекс.Навигаторе, — так и в продуктах сторонних разработчиков.
Сегодня SpeechKit был дополнен тремя новыми технологиями, которые делают общение человека с компьютером более полноценным. Теперь система умеет включаться по голосовой команде, понимает смысл слов, а также не только слушает пользователя, но и отвечает ему — с помощью технологии синтеза речи.
Пользователи мобильного приложения «Моя Москва» теперь могут просмотреть, скачать и переслать электронную квитанцию по почте или с помощью мессенджеров
Помимо этого, ведомство также разрабатывает приложение для видеосвязи, аналогичное Skype и Zoom
Голосовая помощница «Алиса» научилась определять, кто к ней обращается — взрослый или ребенок — и учитывает это при составлении ответа
Вышла новая версия популярного приложения CCleaner, предназначенного для очистки жесткого диска, удаления временных файлов, истории просмотра сайтов и т.п.
Социальная сеть «ВКонтакте» представила мини-приложение «Чеклисты», с помощью которого пользователи могут закреплять хорошие привычки или избавляться от вредных
Пользователи мобильного приложения «Моя Москва» теперь могут просмотреть, скачать и переслать электронную квитанцию по почте или с помощью мессенджеров
Softodrom.ru: 20 лучших условно-бесплатных программ 2007 года
Софтодром рассказывает о различных способах, которые позволяют скрыть папку или отдельные файлы в Windows
Помимо этого, ведомство также разрабатывает приложение для видеосвязи, аналогичное Skype и Zoom
Софтодром решил вспомнить те вышедшие из употребления слова, которые имеют отношение к информационным технологиям
Yandex SpeechKit
Сервис распознаёт и синтезирует речь на нескольких языках.
SpeechKit — речевые технологии голосового помощника Алиса, адаптированные для использования в ваших бизнес-решениях.
Распознавание с учётом контекста
Синтез в реальном времени
Поддержка трёх языков
Премиум-голоса
Прозрачное ценообразование
Решайте свои задачи с Yandex SpeechKit
Автоматизация работы колл-центров
Телемаркетинговые кампании
Управление приложением
Озвучивание курсов и вебинаров
Повышение доступности для слабовидящих пользователей
Готовые бизнес-решения на основе Yandex SpeechKit
Узнайте о задачах, которые голосовые роботы эффективно решают уже сейчас.
Истории компаний
Вопросы и ответы
Как использовать SpeechKit?
Сервис работает через HTTP API. Всё, что нужно для работы, вы сможете найти в документации. Начните знакомство с сервисом самостоятельно или обратитесь к нам. Мы подберём партнёра, который разработает решение специально для вашей задачи.
Сервис работает через HTTP API. Всё, что нужно для работы, вы сможете найти в документации. Начните знакомство с сервисом самостоятельно или обратитесь к нам. Мы подберём партнёра, который разработает решение специально для вашей задачи.
Зачем регистрироваться в консоли Yandex.Cloud?
Для использования API необходимо получить идентификатор (IAM-токен или API-ключ). Этот идентификатор привязан к учетной записи в облаке.
Для использования API необходимо получить идентификатор (IAM-токен или API-ключ). Этот идентификатор привязан к учетной записи в облаке.
Что такое модель распознавания?
Модели распознавания — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. Это позволяет постоянно улучшать качество распознавания.
Модели распознавания — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. Это позволяет постоянно улучшать качество распознавания.
Какие форматы аудио поддерживает Yandex SpeechKit для распознавания?
Сервис позволяет распознавать аудио в форматах LPCM и OggOpus.
Сервис позволяет распознавать аудио в форматах LPCM и OggOpus.
Голосовой ввод текста: 5 бесплатных инструментов
Когда нет времени или возможности что-либо напечатать, на помощь придет голосовой ввод текста. Мы собрали 5 самых лучших и бесплатных инструментов, которые значительно упростят вашу жизнь.
1. Голосовой блокнот SpeechPad
Программу SpeechPad можно установить на Chrome для OS Windows, Mac и Linux, а также скачать приложение на iOS или Android. Во время диктовки используются технологии распознавания речи Google, поэтому точность преобразования довольно высокая, включая знаки препинания. SpeechPad может работать как в онлайн режиме, так и в офлайн. Программа является абсолютно бесплатной. Последующая работа с преобразованным текстом не вызывает никаких трудностей.
2. Текстовый редактор «Google Документы»
Мало кто знает, что «Google Документы» тоже поддерживают диктовку. Чтобы активировать голосовой ввод текста, достаточно зайти в меню «Инструменты» и кликнуть на «Голосовой ввод». После чего на экране появится микрофон, на который необходимо нажать для начала работы.
Сервис также способен распознавать знаки препинания. Для этого необходимо сказать «Google Документу»: «точка», «запятая», «тире» и т.д. Помимо прочего, умный помощник различает команды «новая строка» и «новый абзац». Иногда сервис расшифровывает текст с небольшой задержкой, что скорее всего связано со скоростью интернета.
3. Приложение Яндекс.Клавиатура
Приложение Яндекс.Клавиатура доступно для iOS и Android, но требует подключения к интернету. Оно довольно хорошо распознает русскую речь. Кроме того, программа сама способна расставлять знаки препинания, но некоторые из них иногда пропускает.
4. «Диктовка» на устройствах Apple
Голосовой ввод текста доступен на устройствах от компании Apple. Эту стандартную функцию можно использовать на iPad, iPhone и Mac без каких-либо дополнительных скачиваний. На всех гаджетах, начиная с 2015 года выпуска, «Диктовка» работает даже без интернета.
Чтобы активировать голосовой ввод текста на iOS, достаточно на стандартной клавиатуре нажать на значок микрофона. Если вы хотите использовать «Диктовку» на macOS, необходимо зайти в основное меню Apple, затем выбрать «Системные настройки» – «Клавиатура» – «Диктовка». Здесь нужно поставить флажок «Включена» и выбрать клавишу для быстрого перехода в этот режим. Таким образом, теперь вы сможете использовать голосовой ввод текста в любой программе, в которой можно что-то печатать.
5. Клавиатура GBoard
Клавиатуру GBoard можно скачать на iOS и Android, а затем пользоваться ней в других приложениях и программах. Достаточно нажать на значок микрофона и начать диктовку. На Android GBoard может работать без интернета, чего не скажешь про iOS. Точность распознавания речи и расстановки знаков препинания довольно высокая.
Если вам понравилась эта статья, вы можете угостить автора чашкой кофе на Patreon