Джарвис снова в деле
Наверняка, каждый мечтает о своем голосовом ассистенте, под катом еще одна реализация «Джарвиса» из известного фильма.
Давно не покидала мысль о своем «Jarvis» и управлении техникой в доме голосом. И вот, наконец, руки дошли до создания сего чуда. Над «мозгами» долго думать не пришлось, Raspberry Pi подходит идеально.
- Raspberry pi 3 model b
- USB камера logitech
Реализация
Работать наш ассистент будет по принципу Alexa/Hub:
- Активироваться оффлайн по определенному слову
- Распознать команду в облаке
- Выполнить команду
- Отчитаться о проделай работе либо сообщить запрашиваем информацию
Т.к. моя камера поддерживается из коробки, с драйверами возиться не пришлось, поэтому сразу переходим к программной части.
Оффлайн активация
Активация будет происходить с помощью CMU Sphinx, и все бы хорошо, но из коробки распознание происходит очень медленно, больше 10 сек, что абсолютно не подходит, для решения проблемы нужно очистить словарь от ненужных слов.
Устанавливаем все необходимое:
удаляем все кроме нужного нам Джарвиса:
Теперь pocketsphinx распознает довольно быстро.
Распознавание речи
Сначала была идея воспользоваться сервисом гугла, к тому же его поддержка есть в SpeechRecognition. Но как оказалось гугл берет за это деньги и не работает с физ. лицами.
Благо Яндекс тоже предоставляет такую возможность, бесплатно и предельно просто.
Регистрируемся, получаем API KEY. Все работу можно производить curl’om.
Синтез речи
Тут нам опять поможет Яндекс. Посылаем текст в ответ получаем файл с синтезированным текстом
Jarvis
Собираем все вместе и получаем такой скрипт.
Что тут происходит. Запускаем бесконечный цикл, arecord’om записываем три секунды и отправляем sphinx на распознание, если в файле встречается слово «jarvis»
проигрываем заранее записанный фаил оповещения об активации.
Опять записываем 3 секунды и отправляем Яндексу, в ответ получаем нашу команду. Далее выполняем действия исходя из команды.
На этом собственно все. Сценариев выполнения можно придумать великое множество.
Use-case
Теперь немного примеров реального моего использования
Philips Hue
В приложении Hue устанавливаем статический IP:
Выписываем ID нужных схем, вида «470d4c3c8-on-0»
Конечный вариант скрипта:
В джарвиса добавляем:
LG TV
Берем скрипт отсюда. После первого запуска и ввода кода сопряжения, сам код не меняется, поэтому можно выпилить эту часть из скрипта и оставить только управляющую.
В джарвиса добавляем:
Радио
В джарвиса добавляем:
Еще можно поставить homebridge и управлять всем через Siri, в случае если до джарвиса не докричаться.
Что касается качества распознавания речи, не Alexa конечно, но на расстоянии до 5 метров процент верного попадания приличный. Главная проблема — речь из телевизора\колонок записывается вместе с командами и мешает распознаванию.
На этом все, спасибо.
Ой, у вас баннер убежал!
Редакторский дайджест
Присылаем лучшие статьи раз в месяц
Скоро на этот адрес придет письмо. Подтвердите подписку, если всё в силе.
Похожие публикации
Вывод температуры, пробок и курса валют на светодиодную матрицу Raspberry Pi
Гирлянда на Raspberry Pi
Управление домашними электроприборами («умный дом») через чат бот на Raspberry Pi
Средняя зарплата в IT
AdBlock похитил этот баннер, но баннеры не зубы — отрастут
Комментарии 55
Наверняка, каждый мечтает о своем голосовом ассистенте
Очень даже удобно. Я реально пользуюсь управлением светом.
https://www.youtube.com/watch?v=U-6_s7yuGQE&t=28s
>Наверняка, каждый мечтает о своем голосовом ассистенте
Только если он будет комплектоваться телом-андроидом. Я совершенно не представляю, зачем мне голосовой помошник, который не может ничего сделать. Большинством функций умного дома, как по мне, куда удобнее рулить с графического или текстового интерфейса. Вот попробовал я Кортану — ну, поигрался немного, но так и не придумал ей практического применения. Может быть об этом и мечтают люди, у которых нет навыка работы с клавиатурой (хотя опять же, в большинстве случаев хватает навыков работы с мышью или тач-панелью), но зачем такой помощник гикам — ума не приложу.
Я Алексу прошу
* Включить музыку пока готовлю
* Включить/выключить свет на кухне если руки заняты
* Включить/выключить монитор (на нем нет физической кнопки)
* Включить/выключить свет в зале когда мы на диване телек смотрим к примеру
* Поставить таймер на N минут
* Узнать погоду
* Включить/выключить группу приборов
* Включить отопление
В самом начале еще всякую ерунду типа «сколько лет Путину» или «какое расстояние до солнца» спрашивали. Но быстро надоело. Так да, если выключатель в пределах пары метров, то проще им щелкнуть, чем выговаривать фразу, которую надо еще правильно сформулировать. Но все же Echo dot стоит потраченных 50 Евров, хотя и нервирует иногда, своей тупостью.
Включить/выключить свет в зале когда мы на диване телек смотрим к примеру
Про Алексу. Если тишина, то голос не надо повышать, можно обычным тоном говорить. Если в соседней комнате работает телевизор, то это распознованию практически не мешает. Если в той же комнате (у меня это кухня) булькает к примеру кофеварка или работает вытяжка то приходится повышать голос. Иначе либо не понимает, либо «делает вид», что ничего не услышала. Если телевизор сделать совсем громко, то приходится громко говорить. Если алекса сама музыку воспроизводит, то достаточно, что бы она услышала свое имя, она тут же приглушает звук. У меня зал по соседству с кухней, из зала я тоже могу отдавать комманды, правда приходиться повышать голос и глушить телевизор.
В принципе неплохо работает, иногда есть какие то непонятки. Некоторые слова упорно не хочет понимать, возможно потому, что я на иностранном для меня языке говорю. Хотя в логе видно, что предложение поняла. Говорю к примеру «включи монитор», она все распознала, видно в логе, но все равно переспрашивает, какой девайс я имел ввиду. Если тут скажу «монитор» она его включает. Я обошел эту проблему переименовав монитор в «компьютер». Стала понимать слету, даже шепотом.
Но вот из-за таких непоняток невольно начинаешь повышать голос и говорить как робот. У меня такое чуство, что проблема не в распозновании речи как таковой, а понимании семантики.
По моему личному мнению, с вероятностью в 99,9% такого не будет в ближайшие не знаю сколько лет. А то, может и никогда не будет.
Поэтому только условные сценарии, которые более-менее покрывают потребности обитателей. Ну либо мириться с приличным количеством ошибок, если полагаться на некое подобие искусственного интеллекта, который пытается силой своего скудного разума пронзить привычки человека.
И вот я снова становлюсь занудой. Собственно, здесь (на ГТ) каждый, кому не лень, говорит, что то, что мы называем умным домом, это не умный дом.
Вот и я соглашусь: сейчас дома автоматические. А вот до умного нам как до Марса пешком.
Предположим, вы обклеите все датчиками и даже поставите камеры, которые будут (вместе с другим железом) распознавать пол и возраст каждого. Но вот ситуации:
а) Вы приходите домой один
б) Вы приходите домой с известной дому дамой
в) Вы приходите с неизвестной дому дамой
г) Вы приходите домой с известной дому дамой, которой неизвестно, что в пункте в) вы приходили домой с неизвестной дамой
д) Вы приходите домой с известной дому дамой, с которой романтика уже закончилась
Как дом будет понимать кого как встречать, ну или хотя бы кому какой свет — где поярче, где потише? Вот поэтому я и говорю, что пока что можно базироваться только на сценариях, которые более-менее учитывают общие алгоритмы поведения.
Система джарвис на компьютер голосовые команды. Typle — голосовое управление компьютером
Искусственный интеллект – это больше не выдумка из раздела «Научная Фантастика на третьей полке». Роботы уже давно проникают в дома людей под видом умных колонок и мобильных приложений для смартфонов. За последние годы транснациональные компании серьёзно продвинулись в разработке ИИ. Электронные ассистенты стали гораздо более функциональными, и теперь производители развлекаются тем, что «сталкивают их лбами», пытаясь понять, .
Наиболее толковым из электронных ассистентов является – что и неудивительно, ведь Apple доводила программу до ума целых 6 лет. является фаворитом среди отечественных юзеров, потому как прекрасно понимает русский язык и говорит на нём. Однако пользователям Android-устройств нечего отчаиваться – они также могут загружать на свои смартфоны голосовых ассистентов, которые говорят на русском. Прочитав эту статью, вы познакомитесь с лучшими голосовыми помощниками для Андроид.
Про знаменитую фразу «Окей, Google!» сложено огромное количество анекдотов, а ведь именно с её помощью запускается один из самых умелых голосовых ассистентов для Андроид – . Эта программа является бесплатной; владельцу Android-девайса её не нужно скачивать и устанавливать – ярлычок Google Now автоматически появляется на экране мобильного устройства, как только оно обновляется до Android 4.1.
Google Now можно использовать и на iOS-гаджете. Для этого необходимо загрузить приложение Google из AppStore.
Главное достоинство Google Now – это интеграция со всеми остальными сервисами от компании Google. Пользователь, например, может сделать голосовой запрос в браузере Google Chrome или надиктовать заметку в Google Keep. Также голосом удастся завести будильник, активировать таймер или секундомер, отыскать событие в календарь, создать СМС-сообщение и отправить его абоненту, номер которого забит в телефонном справочнике. На современных версиях Android Google Now интегрирован и со сторонними приложениями – вроде мессенджеров Telegram и What’s App.
К сожалению, до функциональности Siri Google Now всё же ещё далеко – интеллектуальный помощник от «поискового гиганта» способен выполнять относительно небольшое количество голосовых команд. Полный перечень этих команд присутствует на официальном сайте Google .
Главная особенность русскоязычного интеллектуального помощника «Дуся» — полное отсутствие интерфейса. Ассистент постоянно работает в фоне и при этом не занимает ни единого дюйма экрана мобильного гаджета. Запустить приложение «Дуся» можно голосом, взмахом, встряхиванием и множеством других способов.
Разработчики программы акцентируют внимание юзеров на том, что «Дуся» — это не чат-бот, который будет заигрывать с пользователем и рассказывать ему анекдоты а-ля Siri. «Дуся» выполняет те команды, которым обучена – в частности, по голосовому запросу владельца гаджета она способна проложить маршрут на карте, набрать номер, записанный в телефонной книжке, найти музыку в соцсети «ВКонтакте», написать сообщение в What’s App, перевести любую простую фразу на несколько языков. Самое главное – перечень команд, которые понимает «Дуся», не окончательный; он постоянно дополняется. Каждый из пользователей способен предложить свою идею относительно того, как сделать «Дусю» умнее, на специальном форуме .
К числу недостатков программы «Дуся» можно отнести то, что она является платной. Пользователю даётся неделя на знакомство с интеллектуальной помощницей – по истечении этого срока придётся приобрести подписку за 299 рублей.
Ассистент на русском
За невзрачным названием скрывается мощная программа, способная похвастать широким функционалом. «Ассистент на русском» может по голосовым командам искать информацию в Wikipedia, прокладывать маршруты, активировать / деактивировать будильник смартфона, отправлять сообщения, вызывать абонентов, номера телефонов которых «забиты» в телефонную книжку, и выполнять много других полезных действий. Для интеллектуального помощника не составит труда поработать в качестве переводчика – помимо русского он знает несколько европейских языков.
У «Ассистента на русском» есть ещё одна полезная функция под названием «Киноафиша» — помощник рассказывает, какие фильмы идут в кинотеатрах населённого пункта. Однако пока эта функция доступна только для пользователей из двух столиц — Москвы и Санкт-Петербурга.
Достоинством программы является то, что она способна к обучению – пользователь наверняка заметит, что спустя несколько дней «Ассистент на русском» начинает быстрее реагировать на его команды и выполнять их более точно. У помощника есть и недостаток – его «услуги» бесплатны только в течение первой недели. Затем придётся купить полную версию программы за сумму около 500 рублей.
Robin
Приложение «Робин» считается лучшим голосовым помощником для водителя. Автомобилисту не придётся отрывать руки от «баранки», чтобы написать СМС-сообщение, совершить звонок или узнать прогноз погоды. Интеллектуальный ассистент прекрасно справляется с такими задачами, как поиск актуальных новостей и проверка непрочитанных сообщений в соцсетях.
К русификации помощника «Робин» приложили руку подразделения сразу 2-х поисковых гигантов – Google Moscow и Yandex Labs. Результаты превзошли ожидания: «Робин» говорит на русском так, как будто этот язык для него родной.
«Изюминкой» интеллектуального ассистента Robin является его незаурядное чувство юмора. Помощник всегда готов порадовать автомобилиста анекдотом, а в плане забавных ответов даст фору даже «яблочной» Siri. Маркетологи фирмы Audioburst, распространяющей Robin – тоже юморные ребята, ведь иначе они бы точно не смогли создать такой вот шедевральный трейлер:
Окей, Блокнотик!
Функционал приложения «Окей, Блокнотик!» невелик — назвать его полноценным интеллектуальным ассистентом нельзя. Создавать голосом заметки и напоминания – это всё, что позволяет пользователю приложение «Окей, Блокнотик!». Судя по тому, что программа имеет отличные оценки и массу положительных отзывов в Google Play, со своей скромной задачей она справляется на 5+.
Разработчик приложения Д. Лозенко отмечает, что «Окей, Блокнотик!» является аналогом некогда популярной мобильной программы «Помнить всё». Сейчас приложение «Помнить всё» заброшено, поэтому толковых альтернатив «Блокнотику» в Google Play нет.
Функционал программы «Окей, Блокнотик!» можно немного расширить за счёт установки плагинов. Например, при помощи дополнительного софта удастся добавить синхронизацию с задачами Google.
Голосовые помощники на ПК
Управление компьютером тоже можно осуществлять при помощи виртуального ассистента – хотя, увы, лишь немногие пользователи знают об этом. Операционная система Windows 8 включает в себя встроенную утилиту под названием Windows Speech Recognition, которая активируется через панель управления. Windows 10 и вовсе оснащена полноценным интеллектуальным ассистентом Cortana, способным выполнять по голосовым запросам пользователя массу задач – искать и запускать файлы на компьютере, делать заметки и примечания в календаре, настраивать систему.
Увы, у Windows Speech Recognition и у Cortana есть большой общий недостаток: они не понимают русского и не говорят на нём . Cortana на 2017 год владеет всего 6 языками: английским, китайским, немецким, итальянским, испанским и французским. Естественно, со временем Кортана освоит русский и другие языки — однако, долго ли отечественным пользователям «ждать у моря погоды», никто не знает. Поэтому пока стоит обратиться к сторонним голосовым помощникам для компьютеров – благо, варианты есть. Вот лишь некоторые из тех, которые поддерживают русский язык:
- «Горыныч» — ассистент, владеющий как русским, так и английским. «Горыныч» способен выполнять по голосовым командам любые операции, для которых пользователь обычно задействует мышку и клавиатуру. Проблема «Горыныча» заключается в том, что речь он распознаёт весьма посредственно – если владелец ПК вдруг охрипнет, то голосовой ассистент просто перестанет его понимать.
- «Агрегат» — интеллектуальный ассистент для ПК от создателей вышеупомянутой «Дуси». Разработчики утверждают, что «Агрегат» гораздо лучше Cortana по ряду причин: во-первых , «Агрегат» понимает русский, во-вторых , он устанавливается на любую операционную систему (будь то OSX, Windows или Linux), в-третьих , пользователи могут повышать функциональность «Агрегата» путём установки дополнительных модулей. Но в случае с «Агрегатом» опять-таки не обходится без «ложки дёгтя»: программа пока находится на стадии альфа-тестирования, поэтому скачать её просто так не удастся – придётся вступать в специальное сообщество Google + и отправлять заявку на получение копии файлов помощника.
- Typle – простенькая утилита для Windows 7, 8 и 10. Функционал Typle весьма ограничен: программа может открывать файлы и приложения, но при этом не способна, скажем, управлять музыкальным проигрывателем.
Заключение
В скором времени владельцам гаджетов с Android не придётся задумываться о том, какими голосовыми помощниками оснащать свои смартфоны. Ещё в феврале компания Google заявила о намерении заменить на всех Android-аппаратах устаревший Google Now на более современный Google Assistant. «Апгрейдить» голосового помощника можно будет не только на Android 7.0 Nougat, но и на версии 6.0 Marshmallow. Google Assistant пока не говорит по-русски, но совершенно точно скоро будет – об этом представители Google сообщили на выставке I/O 2017.
– это официальный голосовой помощник, изначально встроенный в Windows 10. Вам не нужно скачивать Кортану отдельно, программу нужно лишь активировать. По умолчанию Кортана отключена у всех пользователей, но ее можно включить. Включить голосовой помощник Сortana в России – это целый квест и в этой статье вы узнаете как о самом сервисе, так и о том, как включить Сortana на русском языке на Windows 10.
Сortana – что это за сервис
Возможности Кортаны на Windows 10
Сortana на русском – можно ли скачать для компьютера на Windows 10
Как активировать голосовой помощник Сortana в России
В панели меню «Пуск» необходимо найти кнопку «Параметры» и щелкнуть по ней:
Далее перед вами откроется панель параметров, где одним из последних пунктов будет пункт «Время и язык», вам необходимо выбрать этот пункт и щелкнуть по нему мышкой:
В новом окне у вас будет выбор регионов и языков. Если вы хотите подключить Кортану на английском, то вам нужно выбрать любой англоязычный регион. Для примера, США или Англию. А разделе добавления языков выбираем английский. И перед нами откроется следующее окно:
Система автоматически загрузит письменный пакет английского языка. Ниже вы увидите речевой пакет и его параметры. Вы должны самостоятельно инициировать загрузку англоязычного речевого пакета. Разумеется, для первичной настройки и подключения к Кортане вам потребуется доступ к сети Интернет. Время настройки зависит от скорости вашего Интернета. В том же разделе параметров речевого пакета проследите, что загрузка английского завершена. Далее отметьте английский в пункте о распознавании речи. Чуть ниже есть пункт о распознавании акцента. Вы можете отметить и его, если английский не является вашим родным. Но больших надежд на этот пункт не возлагайте, вам все равно потребуется говорить на достаточно чистом и понятном английском, чтобы Кортана смогла воспринять вашу речь.
После всех изменений вам обязательно нужно перезагрузить ваш компьютер. После запуска вновь откройте меню «Пуск». И в разделе настроек выключите сервис Сortana в качестве личного голосового помощника. Этот пункт будет уже на английском языке, так как мы до этого установили англоязычный языковой пакет. Поэтому, для активации вам нужно выбрать положение «On» в пункте «Cortana can give you suggestions».
Еще до релиза находящегося на стадии разработки, тестирования и отладки интерфейса Cortana для Windows 10 пользователи пытались организовать голосовое управление компьютера. О том, как такую функцию можно реализовать в Windows, вышедших до 10-ки и поговорим в сегодняшней статье.
Cortana
Кортана – голосовой помощник с ИИ, разработанный корпорацией Microsoft для Windows 10, Phone и Android с дальнейшим распространением проекта на XBox и iOS. Она заменяет классическую поисковую строку и выполняет множество действий, в первую очередь, связанных с поиском информации и системных команд, получая их от пользователя в виде голосовых команд. Глубокая интеграция в Windows 10, отсутствие русского языка (пока что), сбор фактически всей информации о пользователе с отправкой на серверы Microsoft и отсутствие финальной версии не дают возможности большинству пользователей получить полноценное голосовое управление собственным компьютером.
Помимо Кортаны существует немало приложений, позволяющих осуществлять управление ПК посредством голосовых команд пользователя. Ознакомимся с самыми распространенными продуктами для решения этой задачи в Windows 7 и 10.
Typle
Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.
Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).
Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).
Speaker
- создание снимков состояния экрана;
- переключение раскладки клавиатуры;
- завершение работы Windows 7;
- запуск приложения;
- открытие файла.
Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.
Разработчики программного комплекса для управления компьютером с Windows 7 и 10 являются первой отечественной командой, выпустившей приложение для решения подобного рода задач. За ядро приложения взята западная «Dragon Dictate», куда внедрили отечественный программный модуль для распознания русской речи.
Кроме выполнения системных команд, Горыныч умеет осуществлять голосовой ввод в текстовых редакторах для Windows 10 с производительностью, превышающей скорость набора текста среднестатистическим пользователем ПК. ИИ приспосабливается к голосу юзера и со временем качество распознавания команд и текста становится гораздо выше, до очередной деинсталляции программы или переустановки ОС без сохранения пользовательских данных.
С системных функций программный комплекс легко выполняет запуск приложений, создание новых текстовых файлов.
Вот и наступила весна… В апреле 2014-го первая альфа версия Дуси появилась на форуме 4PDA.
И вот, спустя два года, Дуся приходит на наши компьютеры . В виде нового проекта под названием Агрегат !
Эта статья о том, что такое Агрегат, что он умеет делать и как его получить.
Что такое Агрегат
Итак, что же это такое — Агрегат? Как вам уже стало очевидно по нашему небольшому видео и нашему новому сайту , это голосовой ассистент для компьютера. Это если совсем коротко. Ну а подробности — далее.
Знакомьтесь — Агрегат
Дуся для ПК готовилась уже давно. Очень давно — с самых первых версий. И вот чем наш Агрегат отличается от Кортаны:
- Понимает русский (да и любой другой язык при желании)
- Работает на любой операционной системе (Windows, Linux, Mac OS X)
- Запускается даже на Raspberry Pi
- Легко расширяется за счет сторонних модулей
- Гибко настраивается под ваши требования
- Имеет открытый API для разработчиков и открытый исходный код
- Интегрируется с ассистентом на Android смартфоне
И да — Агрегат абсолютно бесплатен!
Что же он умеет делать?
Агрегат — словно конструктор Lego — собирается из множества модулей. Какие модули вы установите — то и будет уметь делать ваш Агрегат. Похоже на Скрипты в Дусе, не правда ли? Только модули Агрегата — это полноценные микропрограммы , которые могут выполнять любые действия на компьютере, или даже управлять удаленной техникой (включая ваш смартфон).
Пока Агрегат только в альфа-версии, и на данный момент модулей еще не так много. Но совсем скоро их станет больше! А самый главный модуль уже создан. Это…
Интеграция с Дусей
Альфа-версия Дуси 1.6.0 имеет функцию удаленного управления. Именно благодаря ей вы можете отправлять команды на ваш смартфон прямо с вашего компьютера. А ответы придут обратно на компьютер в виде речи и действий в браузере!
Вы можете писать СМС, звонить, создавать напоминания, узнавать планы, ставить таймеры, слушать новости, выполнять вообще любые команды и скрипты, не беря в руки телефон! При этом диалог тоже поддерживается.
А что же еще?
Модуль «Диктовка» позволит просто продиктовать любой текст, который тут же будет вставлен в поле ввода открытой в данный момент программы.
Например, можно писать поисковые запросы в окне браузера, диктовать текст в текстовом редакторе, писать сообщения в мессенджерах и многое другое.
Посмотрите на видео, как я просто сказал «Дуся агрегат», когда курсор стоял в поле ввода текстового запроса на сайте youtube.com.
Как им пользоваться?
Легко! Так же, как и у Дуси, у Агрегата есть способы активации, распознавание и синтез речи.
Самый простой способ активировать Агрегат и дать команду — это просто зажать пару горячих клавиш на клавиатуре, произнести команду и отпустить клавиши. При этом можно делать паузы — Агрегат будет слушать вас, пока вы не отпустите кнопки!
Распознавание, синтез и активации — это тоже модули Агрегата, которые могут быть разными
Как он выглядит?
Вспомним те славные времена, когда и у Дуси не было никакого интерфейса кроме настроек.
Для компьютерной версии голосового ассистента это намного важнее. Потому что вы можете пользоваться его функциями, не открывая другое приложение, не отвлекаясь от текущей работы. Ничего не занимает экран. Агрегат просто слушает вас и выполняет команды. Быстро и четко!
Хочу! Как его установить?
Сейчас Агрегат находится на стадии раннего альфа-тестирования . Поэтому он доступен только для энтузиастов и программистов, которые всегда стремятся оказаться на переднем крае технологий.
Альфа-тестирование открытое . То есть любой может вступить в специальное сообщество Google+ и отправить заявку на получение копии своего Агрегата.
В сообществе можно задавать любые вопросы и обсуждать их. Документация по проекту и Руководство Пользвоателя уже готовы в первом варианте и доступна в репозитории GitHub . Там же рассказывается в подробностях, где скачать модули, как их настроить и как ими пользоваться.
Там же доступны модули, их описание и исходные коды (для тех, кто желает присоединиться к проекту и стать соавтором первого в мире голосового ассистента с открытым кодом).
Создай свой Агрегат!
Я надеюсь, что вам понравится наш новый проект, в котором каждый может поучаствовать как соавтор. И вы увидите, что только настоящая свобода дает неограниченные возможности вашему воображению по созданию своего собственного голосового ассистента под ПК!