0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Система голосового управления

Система голосового управления

Каждый производитель называет систему голосового управления по-своему. Но и система системе разница. Расскажем о нюансах работы голосового управления и как все устроено.

Содержание статьи:

  • Назначение системы
  • Разновидность
  • Управление мобильной связью
  • Управление мультимедиа
  • Устройство механизма
  • Видео

Голосовое управление не новшество в современных автомобилях, но все чаще и чаще встречается, так как набирает популярности среди покупателей. У каждого производителя есть подобная технология, и называет её каждый по-своему.

Для чего нужна система голосового управления

Первым и главным назначением системы голосового управления является работа с функциями автомобиля при помощи голосовых команд. Они преобразуются с голоса в функции управления и передаются на соответствующие системы автомобиля. Такая система помогает водителю не отвлекаться от управления автомобилем. Как результат увеличивается комфорт и безопасность во время езды.

Ряд производителей называет систему голосового управления по-своему. У компании Cadillac это User Experience, Mercedes-Benz – Linguatronic, Ford – Ford Sync. Так же она очень часто встречается в Audi, BMW, Kia, Lexus. Различаются эти системы голосового управления по разновидности и количеству поддерживаемых языков, количеству команд и число функций способных реализовать.

На сегодняшний день больше всего языков прошитых в систему голосового управления насчитывается в Ford Sync. Как показываются данные это 12 языков, среди них есть и русский язык, а так же некоторые разновидности французского и английского языков.

Разновидности системы

Наверное, первое, чем отличаются, это по уровню распознавания команд. Системы голосового управления, которым нужно было проговаривать команды управления по буквам отходят в прошлое, они жутко не удобные в использовании и часто допускались ошибки в обработке команд.

По стандарту система голосового управления может управлять мобильным телефоном, системой мультимедиа, системой навигации или же климат-контролем. Это еще не полный список функций, которыми могут управлять современные системы голосового управления. В некоторых автомобилях можно завести или остановить двигатель, закрыть или открыть панорамную крышу.

Прогресс идет, и с каждым днем инженеры улучшают и добавляют команды для управления и облегчения водителю.

Голосовое управление мобильной связью

Во многих странах существует закон, который запрещает говорить по мобильному телефону или пользоваться им во время движения. Такая функция обеспечит водителю доступ к списку контактов на телефоне, по номеру или имени абонента. С помощью голоса можно набрать SMS для отправки или же обратно прочитать новые SMS. Для этого мобильный телефон должен быть подключен к мультимедийной системе через Bluetooth или через USB-кабель.

Больше толку от системы будет, если вы владелец IPhone. Для вас будет доступна система голосового управления Siri Eyes Free, разработанная компанией Apple. Посылая голосовые команды, вы можете управлять различными приложениями на смартфоне, набирать номера, прослушивать смс. Прокладывать маршрут в системе навигации смартфона, включать и листать музыку, а так же другими функциями смартфона.

Становится понятно, что набор функций будет пропорционально зависеть от возможностей вашего мобильного телефона и вашей фантазии.

Голосовое управление мультимедийной системой

В отличии от предыдущего варианта, в наличии такого вида системы можно отметить большой список функций. Это и управление меню мультимедиа, прослушивания различной музыки с учетом сортировки, выбор радиостанции приемника, поиск ТВ-каналов, и управление CD-дисками проигрывателя.

Плюсом так же является звуковой сигнал, который система подает, если правильно распознала команду. Так же имитируется двухсторонний диалог с пользователем, для большей реалистичности.

Становится понятно, что именно такой вид системы в будущем вытеснит другие подобные. Чем больше функций способна будет реализовать, и распознать система, тем востребованной она будет покупателями автомобилей. Действительно, намного проще скомандовать то, что тебе надо в дороге и не прилагая усилий получить результат. Это поможет вам больше сконцентрироваться при сложном городском движении или при большой скорости.

Как устроен механизм голосового управления

Как правило, конструкция системы голосового управления объединяет в себе аппаратную и программную часть. К аппаратной части относится микрофон (обязательный в любой системе), он будет воспринимать голосовые команды и фильтровать шум. Как правило микрофон встроен в переднюю часть центрального зеркала заднего вида. Кнопка запуска системы на панели или рулевом колесе так же является обязательной. Главным будет блок управления, который принимает и обрабатывает команды, а далее передает сигналы на разные исполнительные устройства подобно мультимедийной системе, блок управления двигателем и другие системы.

К программной части относится операционная система. Зачастую это бывает iOS, Android или Windows. Бывают отдельные случаи, когда производители производят собственную операционную систему на основе уже известных, тем самым дает больше возможностей для выполнения нового количества функций.

Нельзя сказать, что система голосового управления будет выполнять ограниченное количество функций, в разных автомобилях список будет разным. Некоторые производители предлагают отдельную функцию программирования под себя. То есть вы выбираете функцию, далее проговариваете команду и запоминаете её. Таким образом можно и зашифровать от посторонних ушей, что вы включили или выключили во время передвижения.

Видео принцип работы системы голосового управления:

Заняты руки? Управляем Android смартфоном при помощи голоса

Управление техникой голосом до недавнего времени можно было наблюдать только в фантастических фильмах, описывающих мир будущего. Но уже сейчас дать команду мобильному устройству без использования рук достаточно просто. Выход обновлений программного обеспечения постоянно расширяет функционал этой опции и улучшает распознавание речи. В текущей статье рассмотрим, как работает голосовое управление Андроид, опишем необходимые настройки и основные команды.

Историческая справка

Выполнение команд голосом было применено еще в 2011 году с интеграцией программы Siri в устройствах под управлением iOS.

Первым смартфоном с данной возможностью стал iPhone 4S, но русскоговорящей аудитории компании Apple использовать виртуального помощника до сих пор удается с трудом. Распознавание русского языка остается на низком уровне, требуется дальнейшая доработка.

В устройствах, работающих на Андроид, голосовое управление появилось с выходом версии ОС 4.1.

Приложение Google Now могло выполнять многочисленные действия после произнесения речевой команды. Поддержка русского языка появилась в 2013 году. Программа отлично распознает голос и позволяет существенно расширить функционал смартфона.

Как настроить голосовой помощник

В большинстве прошивок мобильных телефонов и планшетов голосовое управление установлено по умолчанию. В противном случае необходимо посетить Play Market, ввести в строку поиска «Google», открыть страницу и установить приложение.

Далее рассмотрим, как включить голосовое управление:

  • Открыть настройки мобильного телефона, перейти в раздел расширенных параметров.
  • Выбрать пункт «Язык и ввод», затем «Голосовой ввод Google».
  • Нажать строку «Управление голосом (Voice Match)». Активировать опцию «Распознавать Ok Google всегда».

Если нет необходимости в постоянном распознавании голоса, можно разместить виджет приложения на рабочий стол.

В таком случае команду следует начинать произносить после нажатия на значок микрофона.

Особых инструкций касательно того, как отключить опцию, нет. Следует удалить виджет и приложение или отключить функцию постоянного распознавания.

Практическое применение

На практике голосовое управление помогает справляться со многими задачами, оставляя руки свободными. Вот некоторые их них:

  • Запуск приложений без необходимости поиска ярлыка и попадания по маленьким иконкам.
  • Установка маршрута во время нахождения за рулем. Не потребуется отвлекаться от дороги и отпускать управление.
  • Создание снимков на смартфоне, расположенном на штативе.

Список можно продолжать очень долго. Каждый пользователь найдет действие, которое будет удобно выполнять речевой командой.

Голосовые команды

Все действия, задаваемые при помощи слов, могут быть условно разделены на 2 категории:

  • Контроль и изменение функций телефона или планшета. Установка будильника и напоминания, создание заметки, отправка СМС, осуществление исходящего вызова, проигрывание музыки и т.д.
  • Поиск информации в интернете. Задав поисковый запрос, можно быстро получить интересующую информацию. Например, узнать расписание сеансов кинотеатра или счет футбольного матча. Конечно, данных будет больше в отношении крупных городов и популярных мероприятий. Осуществляя поиск касательно небольших населенных пунктов, можно не получить требуемых сведений.

Далее будет представлена информация об основных голосовых командах. Рассмотрим, как следует задавать запрос, и какого результата можно добиться.

Справочная информация

Прежде всего, с помощью голосового запроса можно узнать любую интересующую информацию. Например, столицу какой-то страны, создателя ОС Андроид, самую длинную реку планеты и т.д. Если активировано непрерывное распознавание команд, следует лишь произнести «Ok Google» и задать поисковый запрос.

Среди прочих функций можно выделить следующие:

  • Распознавание мелодии. Требуется сказать «что за песня» и подставить микрофон смартфона под проигрываемый трек. Система постарается распознать композицию и сообщить ее название.
  • Перевод с иностранного языка. Например, как перевести слово «love».
  • Выполнение расчетов. Система сможет легко подсказать квадратный корень из 53, сумму двух чисел, процентное выражение и т.д.
  • Конвертация величин. С помощью голосового управления выполняется конвертация валют, пересчет миль в километры, дюймов в сантиметры и т.д.
  • Стоимость акций компаний и курс валют. Указав запрос вида «цена акций Microsoft», можно немедленно получить требуемый показатель. Также система покажет курс доллара, рыночную капитализацию, стоимость биткоина и прочее.

Набор номера

Чтобы осуществить исходящий вызов, необходимо сказать следующую фразу: позвонить «имя абонента». Если в записи контакта присутствует несколько номеров, система попросит уточнить данные. Необходимо произнести словами «рабочий» или «мобильный», затем порядковый номер (если записей несколько).

Отправка СМС

Подобным образом осуществляется написание и отправка сообщений. Порядок действий будет следующим:

  • Сказать «Ok google».
  • Затем произнести: написать «имя контакта» + текст сообщения + отправить.
  • Сообщение будет отправлено указанному абоненту.

В случае с необходимостью отправки текста через стороннее приложение следует диктовать команду в таком порядке: сообщение + название приложения + имя абонента + текст.

В итоге голосовой запрос будет следующим: сообщение Viber, Андрей, сейчас за рулем, перезвоню позже. Для пересылки добавить «Отправить».

Установка будильника

Чтобы завести будильник, совершенно нет необходимости заходить в настройки часов и выставлять время вручную. Следует лишь произнести «разбуди меня в 7 утра» и время сигнала будет задано. По умолчанию создается разовый сигнал, который будет выполнен в ближайшие 24 часа.

Календарь и время

Голосовой запрос поможет создать напоминание в календаре и добавить текстовую запись. Помощник Google поддерживает такие команды:

  • добавить напоминание;
  • установить таймер на 3 минуты;
  • часовой пояс «название страны»;
  • восход солнца в «название города».

Погода

По части определения текущего состояния погоды голосовой помощник имеет весьма широкий функционал. Запросы можно задавать следующим образом:

  • погода;
  • погода в «название города», если требуется узнать прогноз в месте, отличном от текущего местоположения;
  • ожидается ли сегодня дождь;
  • скорость ветра;
  • возможные осадки завтра.

Навигация

Произнеся голосовую команду, можно узнать текущее местоположение, сориентироваться на местности и проложить путь к интересующему объекту.

Построение маршрута выполняется исходя из средства передвижения: пешком, на велосипеде, автомобиле, общественном транспорте.

Система умеет показывать фотографии расположенных поблизости зданий и значимых ориентиров.

Поисковые команды могут быть следующими:

  • карта Лондона;
  • проложить маршрут до ул. Образцовой, дом 12;
  • рестораны, кафе, магазины, аптеки поблизости;
  • где находится гора Эверест.

Особенно удобно пользоваться голосовым управлением при вождении автомобиля. Задать маршрут движения можно, не отрывая рук от руля.

Контроль функции и запуск приложений

В завершении изучения возможностей голосового помощника рассмотрим изменение настроек системы и открытие приложений. Количество поддерживаемых функций и команд не слишком обширно, но при практическом применении этого оказывается вполне достаточно. В качестве примера приведем следующие команды:

  • открыть Facebook, Instagram или любое другое приложение;
  • увеличить или уменьшить яркость экрана;
  • повысить или понизить громкость;
  • следующая песня плейлиста;
  • включитьWi-Fi, Bluetooth;
  • активировать фонарик;
  • сделать фото;
  • записать видео;
  • открыть будильники.

Рассмотренные выше команды являются основными и помогут использовать функционал голосового помощника в полную силу.

При произнесении задачи следует говорить четко и без запинок, иначе система запутается и не сможет выполнить действие.

В начале речи необходимо полностью представлять команду в голове. После нескольких тренировок дальнейшее использование функции не вызовет затруднений.

Далее кратко опишем принцип работы программы, позволяющей осуществлять голосовое управление всей системой Андроид.

Voice Access

Помимо Ok Google, в операционной системе существует функция, предназначенная для пользователей с ограниченными возможностями.

Voice Access обеспечивает управление голосом в масштабе всей ОС.

Первый запуск программы произошел в 2016 году. В данный момент она все еще находится в режиме тестирования, но уже достаточно хорошо справляется со своими задачами.

В основу программного обеспечения были положены те же технологии, что и для поиска голосом. Активированное приложение присваивает каждому элементу окна порядковый номер. Для воздействия с любым из них требуется лишь назвать расположенную рядом цифру. При этом исключается всякий физический контакт.

Voice Access обладает и другими навыками, распространяющимися на систему в целом. Например, можно открыть браузер, перейти на рабочий стол, пролистать страницу вниз и т.д. Другими словами, приложение заменяет жесты, касания, ввод текста и его редактирование.

Невзирая на статус beta-версии, Voice Access открывает невероятные возможности по части речевого управления системой Андроид. В паре с «Ok Google» они становятся лучшими голосовыми помощниками, существующими на сегодняшний день. Пользователи мобильных устройств никогда ранее не имели столь широких возможностей для простого взаимодействия с телефонами и планшетами.

Как настроить голосовое управление на Андроид

Как настроить голосовое управление на Андроид. Одна из главных задач операционной системы Андроид — это максимально простое и понятное управление устройством. В каждом обновлении появляется всё больше новых возможностей, которые существенно упрощают пользование. Одной из таких функция является голосовое управление Андроид.

Голосовое управление Андроид

Голосовое управление Андроид — это инновационная технология, с помощью которой можно управлять устройством без лишних манипуляций, а только голосом. Эта функция находится в стадии активного развития и усовершенствования.

Ok, Google на Андроид, даёт возможность более эффективно использовать устройство. Голосом можно выполнять много функций и получать качественный результат. К примеру, искать необходимую информацию, включать/выключать приложения и даже набирать текст. На сегодняшний день данная разработка не идеальна и включает в себя различные недоработки.

Все команды, которые возможно осуществить с помощью голосового управления делятся на две группы.

  1. управление функциями самого устройства — если вы хотите послушать музыку, то просто скажите — «Проиграть плейлист», если хотите включить будильник, то произнесите фразу – «Разбуди меня в такое-то время» и так далее
  2. поиск информации — голосовым запросом можно узнать, например, погоду, посмотреть счёт игры любимой команды, найти слова песни и так далее

Но к сожалению, есть и некоторые ограничения в работе голосового управления. Иногда на невостребованные запросы вы не сможете получить информацию. Например, вас интересует расписание сеансов в кинотеатрах Киева, и вы без проблем получите ответ, а вот если вы зададите тот же запрос, но уже касательно менее крупного города, то тут могут возникнуть проблемы, и вы можете столкнуться с отсутствием информации.

Как включить голосовое управление

Для того, чтобы воспользоваться голосовым управлением Ok, Google, необходимо постоянное подключение к интернету. В ограниченных размерах приложение может работать и без интернета, но качество распознавания голоса будет очень плохим и использование функции будет практически невозможным.

Включить голосовое управление несложно. Для этого нужно:

  1. установить приложение Google, если оно у вас уже установлено, то убедитесь, что стоит именно последняя версия
  2. зайти в приложение Google
  3. в верхнем левом углу нажать значок, который выглядит как три горизонтальные линии
  4. далее зайти в «Настройки»
  5. выбрать «Голосовой поиск»
  6. после — «Распознавание Ok, Google» или «На любом экране»

На некоторых устройствах распознавание функции голосового управления доступно не только в приложении Google, но и в других программах. Для этого в программе Google нажмите:

  1. «Настройки»
  2. далее — «Приложения». Там у вас отобразится перечень программ, в которых вы можете использовать Ok, Google

Основными требованиями для работы голосового управления является наличие программы Google версии 3,5 или выше и операционная система Android 4.4 или выше.

Как настроить голосовое управление

Функция Ok, Google всегда активна при условии, если у вас запущено приложение Google или Google Chrome. После активации система зафиксирует ваш голос и в дальнейшем с распознаванием проблем не должно быть. Чтобы осуществить запрос достаточно произнести фразу Ok, Google и сформулировать вопрос или команду.

Как отключить голосовое управление

Отключить Ok, Google не сложнее, чем включить. Для этого нужно сделать следующее:

  1. зайти в приложение Google
  2. в верхнем левом углу значок, который выглядит как три горизонтальные линии
  3. выбрать «Голосовой поиск»
  4. далее «Распознавание Ok, Google»
  5. убрать флажок — «На любом экране» или «Всегда включено»

Команды голосового управления

Ok, Google распознаёт множество разных команд. Нет конкретного перечня выполняемых запросов, так как у каждого пользователя они разные.

Вот небольшой список команд, которые можно осуществить с помощью голосового управления:

  • позвонить любому человеку из списка контактов
  • отправить текстовое сообщения
  • отправить письмо по электронной почте
  • опубликовать запись в социальных сетях
  • отследить посылку
  • запустить приложение
  • узнать погоду
  • проложить маршрут до места назначения
  • найти место, компанию, заведение
  • перевести текст с одного языка на другой
  • определить песню и так далее

Не работает голосовое управление. Какие могут быть причины и как исправить?

Убедитесь, что голосовое управление активно: «Настройки» — «Голосовой поиск» — «Распознавание О’кей, Google». Установите флажок — «Из приложения Google». Также для правильной работы голосового управления необходимо подключение к интернету. Убедитесь, что устройство подключено к Wi-Fi или мобильному интернету. Попробуйте перезагрузить устройство.

Шесть удобных способов использования голосового управления

10 октября 2013

Голосовое управление электронными устройствами, ещё лет десять назад казавшееся фантастикой, сегодня доступно практически всем владельцам компьютеров, смартфонов и планшетов. Между тем мало кто использует эту действительно полезную функцию — просто из-за убеждённости в том, что она не работает. Так вот, на самом деле она работает. Небезупречно, но вполне удовлетворительно. Вот лишь шесть вариантов использования этой всё ещё непривычной функции в повседневной жизни.

1. Веб-сёрфинг на ПК с помощью Google Voice

Владельцам смартфонов под управлением операционной системы Android хорошо известна встроенная функция голосового поиска Google Search, при помощи которой вы можете осуществлять поиск, просто произнося запросы в микрофон устройства. Система распознавания речи автоматически преобразует запрос в текстовый вид и передаёт его поисковой системе.

В «десктопном» браузере Google Chrome теперь также реализована технология Google Voice, и вы можете её использовать на любом настольном или портативном компьютере со встроенным или внешним микрофоном.

Просто откройте браузер, зайдите на страницу поиска Google и щёлкните по иконке микрофона в правом конце поисковой строки. В верхней части окна появится строка с запросом на разрешение использования микрофона, с чем следует согласиться. После этого на экране возникнет большой значок микрофона и слово «Говорите». Произнесите запрос, на экране появится сообщение об обработке, а затем обычная страница результатов поиска Google. Если система не поймёт запроса, она сообщит вам, что запрос неразборчив? и попросит повторить.

Система Google Voice работает весьма убедительно даже не в самом тихом помещении, и с русским языком она чувствует себя весьма уверенно для эффективного использования. Кроме того, в демонстрационном режиме работает и более универсальная система распознавания речи — так называемый «Программный интерфейс веб-речи», который в перспективе позволит заполнять «голосом» различные формы, отправлять комментарии и надиктовывать письма в Gmail.

Просто выберите нужный язык, щёлкните по иконке микрофона и начинайте говорить. Полученный текст можно скопировать в буфер обмена для вставки в другие приложения или сразу передать в почтовый клиент для отправки по e-mail. Наилучшие результаты получаются, если вы отдельно проговариваете каждое слово, что, конечно, вряд ли можно считать верхом совершенства.

2. Диктуем тексты в Google Chromе на русском и других языках

Для диктовки текстов через движок Google Voice в браузере Chrome существует и специализированный сайт Dictation. Он выглядит как тетрадный листок с полями слева и, разумеется, поддерживает распознавание русской речи.

Впрочем, при работе с английским языком Dictation несколько более функционален, поскольку сайт распознаёт англоязычные команды «New Sentence» («Новое предложение»), «New Pararaph» («Новый абзац») и «Stop Listening» («Остановить диктовку»).

Можно также установить плагин Voice Recognition для Chrome, автоматически отправляющий вас на сайт Dictation. При этом приложение интегрировано с Dropbox и Google Drive, благодаря чему можно быстро сохранять надиктованные тексты в ваших «облачных» аккаунтах. Все файлы можно также сохранить на диске компьютера либо отправить по электронной почте.

3. Управляем iPhone и iPad через Siri

В современных смартфонах iPhone и планшетах iPad компании Apple, работающих под управлением операционной системы iOS, имеется собственная функция распознавания речи, встроенная в так называемый голосовой помощник Siri. Текущая версия Siri предполагает обязательное наличие активного подключения к интернету, в то время как уже в следующей отдельные функции голосового управления будут доступны и без такого подключения.

Чтобы запустить Siri, нужно нажать и удерживать в течение пары секунд кнопку Home на iPhone или iPad (предварительно эту службу нужно включить в настройках). К сожалению, Siri до сих пор не поддерживает русский язык, зато качество распознавания английской речи, даже с самыми чудовищными акцентами, можно оценить как превосходное.

Можно задавать Siri самые различные вопросы, включая банальный «Который час». Можно попросить её что-то поискать в Google, сказав, к примеру: «Google Mr. Putin», — после чего откроется стандартная страница результатов поиска Google. Можно найти нужный адрес в адресной книге, запланировать какое-то мероприятие, продиктовать электронное письмо или текстовое сообщение. Самый полный на сегодня список распознаваемых команд на английском языке можно найти, например, здесь.

Существуют неофициальные версии Siri с поддержкой русского языка и русскоязычных команд — например, SiriPort.ru, однако число распознаваемых команд по сравнению с англоязычной версией относительно невелико. Увы, пока не известно, когда Apple реализует официальную поддержку русского языка в Siri: Россия традиционно не входит в число приоритетных рынков для этой компании.

4. Диктуем тексты в iPhone и iPad на русском и других языках

Несмотря на «смышлёность» Siri, она не слишком хорошо справляется с диктовкой, к тому же с русским языком у оригинальной версии возникают затруднения. Поэтому для «диктантов» лучше использовать специализированное бесплатное приложение Dragon Dictation, которое, помимо всего прочего, прекрасно понимает по-русски.

При установке Dragon Dictation попросит дать ей доступ к вашим контактам, что улучшит распознавание знакомых вам имён и фамилий.

Для диктовки нужно просто нажать на виртуальную кнопку записи, для окончания — коснуться экрана. Кроме того, можно включить автоматическое определение завершения диктовки, что удобно, если вы не намерены делать длительные паузы.

Разумеется, наилучшие результаты получаются, если вы диктуете медленно и чётко. После распознавания можно внести в получившийся текст исправления через экранную клавиатуру. Затем его можно отправить по электронной почте либо в социальные сети Facebook или Twitter.

Аналогичную Dragon Dictation функциональность в устройствах под управлением Android обеспечивает программа ListNote, существующая в бесплатной (c ограничением по времени записи) и платной версиях и использующая движок Google Voice.

5. Используем Google Now для управления смартфоном или планшетом на Android

«Электронный помощник» Google Now, появившийся в мобильной операционной системе Android в версии 4.1 (Jelly Bean), позволяет быстро получать персонализированную информацию о трафике, общественном транспорте, предприятиях питания, самые разнообразные новости и прочие данные. И при этом он поддерживает технологию распознавания речи Google Search, а это значит, что ему (как и Siri) можно задавать вопросы «голосом».

К сожалению, как и в случае с Siri, русский язык в Google Now пока не поддерживается: программа понимает только пять языков: английский, французский, немецкий, испанский и итальянский. С перечнем некоторых распознаваемых Google Now команд на английском языке можно ознакомиться здесь. А здесь можно прочитать, как бы эти команды звучали по-русски, если бы этот язык поддерживался в приложении.

6. Используем Google Voice Search в любых приложениях

По умолчанию система распознавания речи Google Voice Search работает лишь в некоторых предустанавливаемых приложениях операционной системы Android. Однако её действие можно распространить и на другие приложения, расширив число поддерживаемых голосовых команд.

Для этого нужно установить бесплатное приложение Utter! Voice Commands, которое пока существует только в бета-версии. После этого вы получаете возможность контролировать голосом большинство функций смартфона или планшета — от поиска в сети и диктовки сообщений до управления медиаплеером и навигацией, от отправки электронной почты и постов в социальные сети до изменения настроек операционной системы и установки будильника. Но, к сожалению, всё по-английски.

Хотя Utter! Voice Commands устанавливается даже на устаревшие версии Android, наилучшим образом приложение проявляет себя с версиями начиная с 4.1 Jelly Bean, в которой некоторые команды работают без подключения к интернету.

Система голосового управления в автомобиле

Современные автомобили «умнеют» с каждым годом, оснащаясь новыми системами и решениями, призванными сделать вождение максимально безопасным и комфортным. Обилие кнопок и переключателей для управления огромным количеством функций и параметров, делает водительское место похожим на пилотскую кабину. Система голосового управления, установленная в автомобиле, позволяет водителю не отвлекаться от дорожной ситуации на манипуляции с кнопками.

  1. Как было раньше
  2. Возможности современных систем голосового управления
  3. Принцип работы и где встречается
  4. Для айфоноводов
  5. У каждого свое

Как было раньше

Первая система, осуществляющая голосовое управление, была настолько далека от совершенства, что удобство ее использования вызывало сомнения. Распознавать слова она еще не могла, требуя проговаривать команду по буквам, вдобавок невысокое качество микрофона и несовершенство алгоритмов шумоочистки не всегда гарантировали правильное определение произносимого, голосовое управление оставляло желать лучшего.

Отсутствие бортового компьютера, интерфейса взаимодействия у многих систем автомобиля, не позволяло управлять ими голосом. Единственный способ что-то им «сообщить» – протянуть руку и нажать/повернуть.

Возможности современных систем голосового управления

Современная система значительно расширила свой потенциал. Разработчики стремятся максимально приблизить формат взаимодействия к естественному диалогу. Разговорный язык, диалекты, посторонние шумы, быстрота произношения, особенности дикции человека и даже нестандартные формулировки команд все меньше становятся препятствием для качественного функционирования.

Перечень функций, «подвластных голосу», постоянно растет. Сегодня таким способом можно управлять:

  • климатом;
  • мультимедийной системой. Помимо уже привычного перелистывания музыкальных треков, радиостанций и TV-каналов, можно слушать чтение текстовых книг, что поможет скрасить времяпровождение в пробках;
  • перемещением по спискам меню;
  • телефоном. К поиску контактов добавилась возможность прослушивать и создавать сообщения электронной почты и SMS. Надо только синхронизировать телефон с автомобилем посредством Bluetooth или кабеля USB;
  • параметрами бортового компьютера, в том числе прослушивать его сообщения;
  • навигацией;
  • электронной почтой;
  • санкционированным доступом к вождению автомобиля по распознаванию голоса человека, его индивидуальной биометрике.

Этот список можно долго продолжать.

Стремление к естественности диалогового общения прослеживается на каждом уровне. Помимо прочего, это:

  1. правильная интерпретация. Система способна расшифровывать сокращения, «знает» многие аббревиатуры, форматы даты и чисел, и так далее, …даже ненормативную лексику;
  2. естественность воспроизводимой речи. Текст, произносимый модулем голосового управления, построен корректно, с правильными ударениями и звучит естественно;
  3. удобство взаимодействия. После успешного распознавания команды подается соответствующий сигнал;
  4. режим постоянного отслеживания команд. Обычно перед подачей команды требуется нажать на специальную кнопку, расположенную на руле, но в некоторых новых реализациях, голосовое управление имеет режим непрерывного прослушивания, и может выделять команды без нажатия на кнопку.

Сюда же можно добавить, что постепенно увеличивается и количество понимаемых языков и диалектов.

Принцип работы и где встречается

Главный модуль голосового управления распознает речевые команды, преобразует их в соответствующие сигналы, которые передаются системам автомобиля, выполняющим требуемое действие. Как правило, микрофон встроен в салонное зеркало заднего вида.

Однако конкретная реализация зависит от установки: штатная это система или доустановленная, ведь речевое управление встречается во многих опционах. Ярким примером здесь выступает охранная система Pandora DXL5000. Ее функции по охране дополнены взаимодействием водителя и автомобиля на любом расстоянии с помощью мобильного телефона. В память сохраняются образцы всех речевых команд. При поступлении устного сообщения (звонок с телефона) ищется 100% совпадение. Если оно не найдено, срабатывает охранная блокировка.

Также можно приобрести модуль голосового управления, не предусмотренный изготовителем вашего автомобиля. В этом случае перечень устройств невелик, как правило, это стеклоподъемники, дворники, салонное освещение и наружная оптика, люк, центральный замок и тому подобное. Подключение таких систем не всегда требует в автомобиле наличия CAN или другой какой-либо шины, подсоединяясь к управляемому механизму напрямую.

Для айфоноводов

Владельцы айфонов не остались без внимания. Компания Apple предоставляет им такую возможность благодаря продукту Siri Eyes Free. Теперь можно голосовыми командами пользоваться популярными приложениями iPhone: звонки, сообщения, навигация, медиа, а также информация о погодных условиях, спортивных событиях, курсе валют и прочее. Как уже было сказано, надо лишь подключить смартфон по USB и перед произнесением команды или вопроса нажать специальную кнопку в автомобиле.

Использование Siri Eyes Free в своих авто одобрили BMW, Audi, Toyota, Land Rover, Jaguar, Honda, Mercedes-Benz и другие. В выпускниках конвейеров Ford, Hyundai и Kia голосовые возможности предоставляет компания Microsoft.

У каждого свое

Не все производители используют разработку голосового управления сторонних компаний. У многих есть собственные достижения в этой области. Среди последних упомянутых, наиболее развитыми можно назвать Ford Sync, CUE для Cadillac (мультимедийная система собственной разработки с голосовыми возможностями), SDS для Audi, Linguatronic для Mercedes-Benz.

Все они имеют свои преимущества и недостатки. Так, система Ford Sync «владеет» 19-ю языками, включая разновидности французского и английского. CUE распознает произвольные фразы, а не только заранее предусмотренные. Название города или улицы, произнесенное для некоторых версий SDS, должно быть озвучено по буквам.

Многие минусы, выявленные водителями, не столь значительны, чтобы система, понимающая устные команды, оставалась без участия. Безусловно, это удобно, а на этапе знакомства кому-то даже интересно. Привыкнув со временем разговаривать со своим автомобилем, некоторые сразу и не скажут, где находится, например, блок управления климатом…
» alt=»»>

Голосовые команды как способ управления умным домом Livicom

Возможность управлять умным домом через голосового ассистента «Алиса» — это результат совместной работы ООО «НПП «Стелс» и команды Яндекс.

С помощью голоса можно включать и отключать устройства Livi, управлять режимами охраны всего дома и конкретных помещений, запускать сценарии автоматизации. Активируйте голосового ассистента и скомандуйте: «Алиса, выключи свет в детской» или «Алиса, включи охрану гаража».

Алиса, открой ворота – у нас гости

Голосовой помощник управляет подъездными воротами и шлагбаумами с помощью реле, включает свет и подсветку в разных комнатах через модуль управления светом, останавливает подачу воды через модуль защиты от протечек с подключенными шаровыми электрокранами.

Кроме этого, Алиса умеет управлять обогревателями и теплыми полами, поддерживает заданную температуру. Ассистент может отключить сирену, открыть или закрыть шторы и рольставни на всех окнах.

На страже порядка!

Голосовой помощник может включать охрану как всего дома, так и отдельных комнат, строений или объектов, например, кабинета, бани или сейфа.

Алиса, работа не ждет

Чтобы управлять разными подключенными устройствами одновременно, добавьте их в сценарий и задайте любую фразу для запуска. Кроме устройств в сценарий можно добавить режимы охраны дома или отдельных комнат.

Скажите: «Алиса, работа не ждет», и тут же погаснет свет в доме, закроются шторы, приборы отопления перейдут в режим энергосбережения и включится охранная сигнализация.

Главней всего – погода в доме (с.)

Алиса умеет управлять не только устройствами умного дома Livicom, но и бытовой техникой других брендов, которые интегрированы с сервисами Яндекс. Это могут быть, кофеварки, мультипекари, чайники, телевизоры, диммируемые лампочки, увлажнители и т.д. Каждое устройство можно использовать в сценариях и запускать вместе с оборудованием Livi.

Например, в сценарий «Алиса, мама едет» можно добавить робот-пылесос, увлажнитель воздуха, теплый пол. Скажите: «Алиса, мама едет», и верная голосовая помощница начнет уборку в гостиной, поможет избавиться от сухости воздуха и создаст комфортный микроклимат!

Речевые технологии — следующий уровень сервиса

Рубрика: 1. Информатика и кибернетика

Опубликовано в

Дата публикации: 04.12.2015

Статья просмотрена: 2579 раз

Библиографическое описание:

Петрушенко, А. А. Речевые технологии — следующий уровень сервиса / А. А. Петрушенко, Р. В. Петрушенко. — Текст : непосредственный // Технические науки в России и за рубежом : материалы V Междунар. науч. конф. (г. Москва, январь 2016 г.). — Москва : Буки-Веди, 2016. — С. 6-8. — URL: https://moluch.ru/conf/tech/archive/164/9303/ (дата обращения: 03.11.2020).

В данной статье речь пойдет о новой распространяющейся технологии управления голосом. Будет рассказана история возникновения, тенденции развития речевых систем, основные принципы работы технологий управления голосом, проблемы. Описаны сферы применения в повседневной жизни, бизнесе и медицине.

Ключевые слова: речевые технологии, управление голосом, голосовые технологии, синтез речи, сегментация, распознавание речи, обработка речи.

Введение

Создание систем автоматического распознавания речи достаточно актуальное направление в сфере развития информационных технологий. Мало кто задумывается о том, на сколько эти технологии уже распространены в нашей жизни. Но многие разработчики считают, что эра помощников с голосовым управлением уже не за горами.

Речевые технологии — это новейшие технологии XXI века, благодаря которым появилась возможность с помощью голоса управлять компьютерами, автомобилями, бытовой техникой.

История возникновения

В 1939 году была продемонстрирована первая в мире система автоматического распознавания речи в Ленинградском Государственном Университете Мясниковым.

Работы по компрессии и по автоматическому распознаванию речи шли еще в 50-х годах XX века.

В 60-х годах СССР опережал другие страны в разработках в области речевых технологий. С 70-х годов в разработке речевых систем США начали выходить на лидирующий план, но до середины 80-х уровень теоретических и прикладных разработок в СССР и США оставались приблизительно одинаковыми.

В 80-х годах прекратилось финансирование этого направления в СССР, в следствии чего разработка речевых систем резко прекратилась.

В настоящее время в области речевых технологий активно работают страны: США, Япония, Канада, Австралия.

Идеи и тенденции

Можно рассматривать голосовые технологии через три основные составляющие.

Первая — система синтеза речи.

Синтез речи — это технология, которая дает возможность воспроизвести текст, как можно более похожим естественным человеческим голосом. Чтобы синтезированная речь звучала натурально, следует решать такие задачи, как плавность звучания, интонации, правильная расстановка ударения, расшифровка сокращений. Примером синтеза речи может служить вся дискография, радио.

Вторая — система распознавания речи.

Распознавание речи — системы, которые позволяют преобразовывать в компьютерную форму, представленную слитную проблемно-ориентированную человеческую речь. В настоящее время разработаны системы, которые могут разобрать ограниченное количество слов. Задача, распознавания произвольного слитного устного текста, все еще не решена. В пример разбора речи информационными системами можно привести новый голосовой поиск от Google, так же и его ближайшего конкурента Яндекс, который запустил подобный сервис.

Третья — интерфейсная система.

Для совместного использования синтеза и распознавания речи нужно иметь некоторую систему, которая должна понимать, когда следует синтезировать, а когда распознавать полученную извне информацию. Иными словами, интерфейс. Речевому интерфейсу уделялось, мало внимания, поскольку многие разработчики считали, что для начала активного использования такой системы, будет достаточно создать хорошую программу распознавания речи. В качестве примера можно привести голосовой интерфейс — информационную систему дистанционного управления объектом GLASIS.

Основные принципы работы технологий управления голосом

Голосовое управление — это способ взаимодействия с устройствами при помощи голоса. Считается, что это следующая стадия управления техникой, после сенсорного ввода информации. Преимуществами голосового управления можно считать возможность удаленного и интерактивного взаимодействия с устройством, а также отсутствие с ним тактильного контакта. Голосовое управление происходит по следующим этапам — сегментация, распознавание речи, отклик на требуемую задачу.

Обработка речи начинается с определения уровня помех и искажений, полученного речевого сигнала. Далее в сигнале выделяются участки, которые содержат речь, и происходит оценка информации о формах слов. Этот этап называется сегментацией.

Далее параметры речи поступают в декодер, где сопоставляются входные речевые потоки информации с потоками, хранящимися в акустических и языковых моделях устройства. Там же определяется некоторая наиболее вероятная последовательность слов, которая в итоге будет являться результатом. Это этап распознавания речи.

Последнее — отклик на требуемую задачу. На этом этапе процессор, встроенный в используемое устройство, обрабатывает полученную команду. И если она совпадает с той, что хранится в его встроенной базе данных, то устройство выполняет требуемую задачу, если же команда отсутствует, то используемое оборудование оповестит о невозможности ее выполнения.

Проблемы развития речевых технологий

Основные проблемы, которые возникли перед разработчиками систем речевых технологий:

Невозможность полностью подавить внешний шум. Системы очень чувствительны к шуму окружающей среды. И любые внешние помехи препятствуют правильному распознанию речи.

Повышение точности распознания слитной речи. Поскольку сама система распознавания речи — это сложный процесс согласования данных, то любая, даже незначительная ошибка, может привести к получению неверного результата.

Чувствительность систем к речевым оборотам диктора. От дикции человека зависит очень многое, но так как система направлена на широкое использование, то функционал программы, отвечающий за распознавание речи, должен быть очень гибким.

Стоимость приложений. Технологии распознания голоса требуют больших инвестиционных вложений. Здесь необходимы крупные вложения, как в аппаратную часть, так и в средства разработки программного обеспечения.

Проблема идентификации пользователя по голосу. На данный момент системы распознания речи слишком неточны. В итоге, чем выше скорость отклика программы, тем выше шанс, что человек получит несанкционированный доступ к информации.

Разработки речевых технологий в России и за рубежом

В России одной из ведущих компаний по разработке речевых технологий является «Центр речевых технологий» (ЦРТ). В настоящее время ЦРТ является ведущими разработчиками инновационных систем в сферах синтеза и распознавания речи. За последние месяцы компания выпустила VOCO (новое решение для преобразования речи в текст), представила программный комплекс интеллектуального анализа спонтанной речи, повысила эффективность управления аэропортом «Шереметьево», а также приняла участие в крупнейшей Российской выставке технологий «Интерполитех-2015».

Аналогом ЦРТ, а также мировым лидером в области развития речевых технологий является корпорация NuanceCommunication. Это производитель программного обеспечения, штаб которой расположен в США. Компания разрабатывает приложения распознания речи в веб сервисах и системы автоматизированной обработки звонков.

Последние из разработок Nuance:

IVRCallerVerification технология с большим функционалом, позволяющая оценивать эффективность сотрудников, настраивать переадресацию входящих звонков, идентификацию пользователей и многое другое в полностью автоматическом режиме.

FreeSpeech — эта система позволяет идентифицировать абонента в ходе естественного разговора, извлекая необходимые голосовые характеристики (например, тон голоса или акцент).

VocalPassword — это двух шаговая идентификация по голосу пользователя и какому-любо паролю. Для защиты пользователя от взлома при помощи записи голоса, пароль повторяется несколько раз, и результаты должны различаться. Минус этого подхода затраты времени на повторение пароля и анализ данных программой.

Сферы применения голосового управления

Речевые технологии охотно используются в медицине, например, для коррекционно-развивающей работы с людьми, у которых имеются нарушения звукопроизношения и/или слуха.

Речевые системы так же внедрены и эффективно работают в банковских организациях. Они используют технологии голосового самообслуживания и обеспечивают быстрый доступ абонентов к запрашиваемой информации.

Новым шагом авиационных компаний стало использовании технологий распознавания естественной речи, что позволило значительно улучшить качество обслуживания пассажиров, а также сократить расходы.

Голосовые системы самообслуживания помогли операторам телекоммуникационной связи улучшить процесс обслуживания абонентов, поскольку ускорилась обработка звонков, уменьшилось количество ошибочных соединений, усовершенствовалась защита персональных данных клиентов.

Организация голосовых центров самообслуживания в компаниях, которые работают в различных сферах страховой деятельности, также помогла повысить качество обслуживания клиентов, обратившихся в контактный центр и сократить расходы.

Так же в последнее время речевые технологии популяризовались и в повседневной жизни, быту. Например, в помощь молодым родителям производят «электро-няню», на сегодняшний день она уже имеет и звук, и видео, и обратную связь.

Системы голосового управления помогают обеспечить контроль над некоторыми функциями автомобиля. Эти технологии позволяют водителям, не отвлекаясь, вести автомобили, тем самым обеспечивая безопасность движения на дороге.

Заключение

На данный момент применение речевых технологий в бизнесе связано с большими затратами на оборудование и сопутствующее программное обеспечение. Однако, несмотря на экономическую дороговизну этой новинки, она уже окупает себя. И постепенно внедряется все большим числом предприятий.

Технологии не стоят на месте и суммы инвестирования в область речевых технологий, только растут. Со временем обязательно появятся недорогие аналоги, которые все больше будут заменять человека в обслуживании звонков и заказов. На данный момент, уже есть наработки гидов для музеев и других голосовых помощников.

Конечно, сейчас это больше утопия, поскольку компьютер еще не способен разговаривать с интонацией, а полноценное распознавание слитной устной человеческой речи — невозможно. Но факты говорят о том, что эра голосовых помощников не за горами.

Система голосового управления автомобилем: основные функции и направления развития

Сегодня автопроизводители стараются не стоять на месте и норовят применять на практике идеи, которые раньше мы относили к научной фантастике.

Хотите прогреть авто перед поездкой, завести двигатель, включить музыку или добавить новый маршрут? Это и многое другое становится реальностью.

Корейская компания Hyundai обещала начать производство авто с голосовым управлением с 2018 года с системой управления голосом Blue Link Agent, работающая с Google Assistant. Ford SYNC и Fiat Blue & Me также обладают программой распознавания голоса. Компания «Яндекс» создала первое в России беспилотное такси с голосовым управлением, которое уже проходит тестирование.

Голосовое управление машиной возможно благодаря программе, которая распознает голос. Количество команд, которые эти системы могут понять, растет с каждым днем.

Далее мы рассмотрим некоторые из наиболее полезных команд. Узнаем что могут сделать авто уже сейчас, и на что они могут быть способны в ближайшем будущем.

  1. Звонки
  2. Управление микроклиматом автомобиля
  3. Автопилот
  4. Управление электроникой автомобиля
  5. Набор текста и отправка сообщений

Звонки

В России, как и в большинстве стран мира, водителю запрещено разговаривать по телефону, прижатому к уху во время движения авто. Это гарантирует получение не дешевого штрафа, не говоря уже об опасностях таких разговоров… Вот почему популяризируется Bluetooth гарнитура для телефона, что позволяет не убирая рук от руля вести беседу.

Но есть проблема: набор номера телефона или поиск его в контактах все же требует внимания водителя. Эта трудность решена в авто с голосовыми командами для телефонов. Поэтому вместо того, чтобы останавливаться или «на ходу» искать нужный контакт, просто скажите: «Позвони Маме».

Часто в адресной книге один человек имеет несколько номеров: мобильный, домашний, рабочий. Разработчики это предусмотрели и программа способна даже выбирать необходимый для пользователя номер. Для этого скажите: «Позвони Стасу Иванову на рабочий». А вы пользуетесь данными опциями в пределах одного контакта?

Управление микроклиматом автомобиля

Прохладно в кабине? Не можете вспомнить, какая кнопка отвечает за подогрев воздуха? Или не хотите вычитывать эти загадочные символы на приборной панели? Просто попросите автомобиль сделать это за вас и пусть он беспокоиться о деталях. Многие авто будут реагировать даже на синонимы для этой команды, таких как «сделай теплее в авто» или «нагрей в салоне» (или наоборот, «сделай прохладнее» или «охлади в салоне»). Конечно, это немного похоже на разговор с не особо умным искусственным интеллектом, но это большой шаг вперед на пути к обеспечению бОльшего комфорта и безопасности дорожного движения.

Автопилот

Тестирование автопилотных моделей авто в мире уже идет полным ходом. Германия, США, Корея уже давно начали пробные поездки. И наша Москва не отстает.

Тесла проехала на беспилотнике 3-е транспортное кольцо в 2018 году. Программа отлично распознавала дорожную разметку, пешеходов, самостоятельно разгонялась и тормозила. Даже если водитель присутствует в машине, автопилот успешно выполняет управление. Интересная функция «режим утомления водителя», при которой программа «переживает», чтобы водитель не уснул и просит положить руки на руль во избежания засыпания человека.

Российская компания «Яндекс» создала первое в России беспилотное такси. В том же 2018 машина на автопилоте проехала от Москвы до Татарстана. Город Иннополис стал первым городом в Европе, где можно заказать беспилотное такси! «Яндекс» работают на базе Камаз и Toyota.

Хоть такси беспилотное, но в салоне пока присутствует инженер, который в случае необходимости может переключить управление автомобилем на себя.

Конечно, мы еще не дошли до того момента, когда авто среднестатистического российского жителя может выполнять функцию личного шофера. Но GPS устройства в автомобилях стали довольно распространенными. И если вы планируете поездку по неизвестному маршруту, достаточно дать голосовую команду: «Проложи маршрут от Проспекта Ленина 11 до Площади Армейской 1». Предварительно хорошо бы сохранить такие ваши часто используемые данные, как адрес дома, работы, чтобы облегчить поиск, как это позволяет сделать Алиса от Яндекс в Навигаторе. И хоть иногда бывают некоторые сбои, вроде неправильно выбранного города и прочее, это все таки лучше, чем набирать на сенсорной клавиатуре адрес во время управления авто.

Управление электроникой автомобиля

Для управления электроникой вашего авто пока понадобится дополнительные устройства, вроде iPod dock station, Amazon Echo, но удовольствие от использования просто зашкаливает!

Только ленивый не слышал про электромобили Tesla. Самое знаковое событие состоялось в феврале 2018, когда Tesla Roadster запустили в космос в направлении Марса. Так вот авто Илона Маска тоже обладают функциями голосового управления электроникой авто на базе Amazon Echo. Теперь уровень заряда и расстояние, которое можно проехать, водителю сообщается голосом. Доступен ряд других голосовых команд:

  • поморгать фарами,
  • узнать время,
  • открыть/закрыть зарядной отсек,
  • блокировка дверей (открыть или закрыть),
  • подать звуковой сигнал (например, если нужно найти ваше авто на стоянке)
  • включить музыку,
  • поднять/ опустить люк/крышу и др.

Если вы обладатель последних моделей iPod и iPhone от Apple, Inc., вы можете сказать, какой альбом или исполнителя хотите прослушать. Ваше устройство конечно же не будет звонить на радиостанцию к ди-джею с заказом песни. Песня будет воспроизводиться с устройства автоматически без каких либо поисков в плейлисте с вашей стороны. Времена, когда мы перебирали аудиокассеты или диски уже уходят в далекое прошлое.

Набор текста и отправка сообщений

Придет ли когда-нибудь время, когда вы сможете заставить свой автомобиль печатать текст во время езды? Конечно, и этот день наступит очень скоро!

Немецкая автомобильная компания BMW имеет прототипную систему, которая позволяет водителю диктовать и передавать сообщения электронной почты, не прикасаясь к компьютеру или смартфону. Некоторые автомобили уже используют ваше соединение Bluetooth для чтения вашей электронной почты вслух, но теперь вы сможете составить ответ устно с полным набором функций редактирования, так же, как вы бы делали на клавиатуре Вашего компьютера или Blackberry-клавиатуре.

Ford тоже планирует сделать что-то похожее с его системой синхронизации и General Motors имеет Android-приложение для диктовки электронной почты с помощью встроенных систем OnStar.

С таким быстрым прогрессом в машине будущего можно будет не только безопасно и комфортно добраться из пункта А в пункт Б, но и получить полноценную психотерапевтическую консультацию от искусственного интеллекта. Одиночество нам не грозит

Голосовое управление светом: как сделать умную систему своими руками

Сама по себе система «Умный дом» подразумевает дистанционное управление практически всеми доступными приборами и устройствами.

Причем, исполнение команд не ограничивается функциями «включить/выключить» или «открыть/закрыть».

Для медиа-устройств еще должны работать функции «тише/громче», для освещения – «ярче/темнее».

Все эти команды можно подавать со смартфона, но намного удобнее голосовое управление светом, музыкой, отоплением, входной дверью.

Для чего необходимо управление «Умным домом» голосом

«Умный дом» – это не просто дорогостоящая игрушка. «Умный дом» – это аппаратно-программный комплекс различных приборов и устройств, делающих жилище безопасным, комфортным, удобным для проживания.

Управление всеми этими приборами осуществляется с помощью разномастных ПДУ, которыми производители снабжают практически все свои изделия.

Как результат – в доме появляются несколько пультов, а обитателям его необходимо помнить алгоритмы работы с техникой.

Подача управляющих сигналов «Умному дому» от смартфона имеет свои минусы. Во-первых, гаджет необходимо постоянно носить с собой из комнаты в комнату.

Во-вторых, его аккумулятор может разрядиться, сам смартфон может потеряться, попасть в руки злоумышленников. Поэтому оптимальное решение для «Умного дома» – устройство голосового управления. Это устройство избавит обитателей дома от необходимости держать в каждой комнате по ПДУ, запоминать разные алгоритмы работы.

Такое управление в системе «Умный дом» приводит к ненужности разнокалиберных ПДУ, работающих на разные «точки входа».

Голосовое управление светом, любой кухонной техникой, отоплением, роботом-пылесосом, климат-контролем, системами безопасности можно осуществить из любого места дома.

При работе с голосом должны быть приняты меры для защиты от несанкционированного доступа в систему – система паролей, условных сигналов.

Для осуществления голосового управления освещением предварительно производится детальная настройка систем распознавания голоса.

Система должна распознавать голоса всех обитателей дома, а не только одного. Она должна уметь понимать команды «включить», «выключить», «ярче», «меньше», привязывать их к конкретным осветительным приборам.

Самодельная система голосового управления освещением

Сделать своими руками управление освещением голосом – задача не из простых. Для ее решения мало одного желания.

Необходимо тщательно продумать схему, рассчитать электрические параметры, подобрать комплектующие, определиться, какое программное обеспечение будет использовано, не потребуется ли его модификация, что может подойти из уже существующих разработок, что можно модифицировать. Желательно уметь работать с паяльником, с тонкой электроникой.

Но сделать самому голосовое управление светом по принципу «Вкл./выкл.» – это просто смастерить эффектную игрушку. Ведь если сделать так, что голосом можно управлять только включением или выключением отдельно взятого осветительного прибора или группы приборов, то почему нельзя такую же функцию распространить и на другие устройства?

Чтобы уже получилась законченная, открытая для расширения система, получившая название «Умный дом».

Готовые модули для работы с голосом

Любая подобная система начинается с модуля распознавания голоса. Первые структуры распознавания акустических сигналов реагировали на хлопки: один хлопок – «включить», два хлопка – «выключить».

Современные структуры распознавания голоса представляют собой сложные аппаратно-программные устройства, способные различать сотни командных посылок, поданных голосом, причем, голоса могут быть различного тембра, различной громкости, произносимые слова могут иметь синонимы.

Наиболее доступные для самоделок модули:

  1. Voice Recognition Module V3.1 (FZ0475);
  2. Robotech SRL EasyVR Shield0;
  3. Voice Recognition Module LD3320;

Каждый из этих модулей имеет свои достоинства и недостатки. Elechouse Voice Recognition Module V3.1 ориентирован на работу с комплектом «Arduino».

Robotech SRL EasyVR Shield 5.0 имеет три алгоритма работы – точный, фонетический и тоновый. Voice Recognition Module LD3320 умеет редактировать ключевые слова.

Простейший голосовой выключатель освещения

Вначале следует определиться со схемой и комплектацией голосового выключателя света.

В простейшем случае в состав такого прибора войдут:

  • модуль распознавания голоса;
  • усилитель;
  • контроллер;
  • микрофон;
  • управляющее реле (количество зависит от того, сколько осветительных приборов будет подключено к выключателю);
  • блок питания на пять вольт;
  • компоненты схем – светодиоды, резисторы, конденсаторы, симисторы, монтажные розетки и др.

Усилитель необходим для того, чтобы прибор мог воспринимать сказанные слова, поданные из любой точки помещения, а не только вблизи микрофона.

Контроллер собран на базе микроконтроллера «Аtmega8», имеющего собственные оперативное и постоянное запоминающие устройства.

Симисторы используются, во-первых, в качестве силовых ключей, а, во-вторых, в качестве диммеров, регулирующих яркость освещения. Протокол обмена информацией – UART.

Как работает голосовой выключатель

Алгоритм работы такого выключателя следующий. После первоначального включения необходимо выдержать паузу в несколько секунд для того, чтобы загрузился сам модуль распознавания голоса, инициировались все устройства прибора. Затем нужно установить защиту от несанкционированного включения.

Ведь сказать, к примеру, «включить свет» может каждый, и прибор отреагирует соответствующим образом. Это же относится и к сигналу, противоположному по значению.

Поэтому нужно задать комбинацию инициализации, для чего следует произнести условное слово, какое-нибудь имя. При произношении этого слова загорится сигнальный светодиод, подтверждающий, что прибор готов к работе.

Далее может последовать любая команда: «Включи люстру», «Включи торшер», «Включи ночник». Эти сигналы должны быть запрограммированы при настройках прибора. Команды распознаются модулем, передаются на контроллер.

Контроллер, в свою очередь, обрабатывает информацию и формирует управляющий сигнал на реле, включая заданное устройство. По команде «Выключи люстру», «Выключи торшер», «Выключи ночник», контроллер дает управляющий сигнал на отключение.

Включение голосового управления светом в систему «Умный дом»

Чтобы интегрировать голосовое управление освещением в систему «Умный дом», не нужно обладать специальными знаниями. Это просто сделать на базе комплектов «Arduino».

Чтобы система работала, нужно в каждой комнате разместить чувствительные микрофоны. Через модуль распознавания речи команды будут поступать на контроллер.

Предварительно контроллер через компьютер должен быть запрограммирован на определенные команды. Тогда из любого места в доме можно будет голосом управлять любым устройством в любой комнате, а при необходимости и во дворе.

Заключение

Существуют разработки для смартфонов, позволяющие управлять голосом системой «Умный дом».

Для этих разработок выпускается специальная периферия с кодами доступа.

Для самодельной системы, собранной на базе «Arduino» таких ограничений нет.

Можно делать и подключать к «Умному дому» любые устройства, а не только освещение.

Видео: Голосовое управление освещением Lutron, Alexa

Читать еще:  Новая Mazda 3 2014
Ссылка на основную публикацию
ВсеИнструменты
Adblock
detector
×
×