Мы, люди увлеченные техникой и технологиями, частенько размышляем о дне завтрашнем. О том, как преобразятся наши гаджеты, какими способностями обрастут и какие возможности смогут обеспечить. Как в целом изменится наша электронно-цифровая жизнь. Но одно дело мечтать, а совсем другое — уже сегодня прикоснуться к реалиям грядущего завтра. Вот этим и займемся, а если конкретно, оценим перспективы голосового общения с гаджетами.

Что нам потребуется?

iPhone, что вполне ожидаемо. Лучше, если это будет iPhone 4S или iPhone 5. А также доступ в интернет, не важно, быстрый Wi-Fi или печальный EDGE. И немного софта для экспериментов (бесплатно):

Ну и как упустить из виду главную даму Apple — Siri? Хотя наших широт она и не знает, как и не сведуща в великом и могучем русском языке, более функционального и глубоко интегрированного голосового приложения в iOS не наблюдается. Так что Siri нужно включить.

Эксперименты

Siri

Тема не нова, но в рамках нашего эксперимента Siri не обойти стороной. Как вам хорошо известно (после 30 минут игрищь в Siri-шутки сразу после покупки iPhone), голосовой помощник худо-бедно понимает простую речь (поддерживается не так много языков), умеет выполнять ограниченное количество команд и в теории позволяет чуть-чуть управлять телефоном без рук. В арсенале робота такие полезные возможности, как звонок определенному контакту, создание новых заметок, сообщений с надиктовкой текстов, напоминаний и событий календаря, а также локальный поиск и поиск в Сети. Есть и менее полезные способности, как то твиттинг и фейсбуччинг, познания в американском спорте, кино и ресторанном бизнесе (купить билеты на бейсбол или забронировать столик “У Луиджи”).

  

В рамках наших изысканий Siri можно поднапрячь в организации дел (напомнить “Buy a milk tomorrow at 6”, запланировать “Meet with Alex at 9 a.m.”), надиктовать пару ставящих адресатов в ступор нерусским языком писем и сделать проникновенную заметку в Заметках. Позвонить у вас скорее всего не выйдет, так как записанные по-русски контакты американка распознать откажется.

Если абстрагироваться от наших суровых реалий, некоторые рутинные операции голосом выполнять и правда куда быстрее, чем чередой команд и вводом тектовых полей. Те же звонки, короткие сообщения или письма, да и напоминания очень удобно делать глосом, да еще не нажимая кнопок вообще (опция включается в настройках Siri).

Google Search

В отличии от Apple, в Google про русскоязычное население глобуса не забыли. Пусть приложение Google Search и не интегрировано в систему, вызвать его можно быстро, как и почти сразу взяться за голосовой поиск. А если ваш гаджет пережил Jailbreak, то и на долгое нажатие Home функцию назначить можно.

  

Однажды попробовав поискть голосом, к архаичному тап-по-клавиатуре методу возвращаться будет очень неохота. Качество распознавания речи великолепно, система обучаемая — через какое-то время она еще лучше будет вас понимать. За исключеним постановки поисковой команды с легким налетом волшебства, все обыденно — Google исправно ищет страничку “кинотеатра IMAX в Киеве”, подсказывает прогноз погоды на завтра в Абу-Даби, рассказывает любопытные факты, переводит слова, считает 12094 х 234 и делает другие классные штуки.

Dragon Dictation

Приложение от создателей передовых голосораспознавательных технологий Nuance Communication (Siri и почти все “голосовые наборы” используют их разработки) умеет переводить речь в текст. В силу ограничений iOS глубоко забраться в недра системы оно не может, так что придется часть работы делать ручками: надиктовали голосом -> экспортировали текст через меню.

  

В качестве эксперимента надиктовал первый абзац этого чтива. Результат не поражающий воображение (было пару несильных промахов, запятые да точки упускаются), но очень достойный. Если представить, что технология со временем еще больше отточится, можно будет забыть про изнурительное тапанье по клавиатуре. Во всяком случае, в тихих местах, где ваше общение с телефоном не поймут превратно.

Any.DO

Этот крутецкий список дел попал в чтиво благодаря возможности надиктовывать текстовки заданий голосом на русском языке. На практике опция оказывается и правда очень полезной — мой ежевечерний марафон составления планов стал проходить куда быстрее, да и браться за это невеселое занятие значительно приянее. Качество распознавания чуть ниже, чем у Google (субъективно), но все же очень хорошее.

Собрать воедино

Установив весь необходимый софт, можно приступать к экспериментам. Я на протяжении недели активно болтал с iPhone 5, производя голосом так много операций, сколько было вообще возможно. И к выводам пришел следующим:

  1. Технологии даже сегодняшнего дня вполне пригодны для ежедневного использования. В том же Any.DO распознование голоса более чем гармонично, а надиктовка сообщений через Dragon Dictation видится вполне удобным занятием.
  2. Тотальная системная интеграция является залогом популярности технологии. Управлять голосом нужно всем устройством, а не несколькими его функциями. В современных реалиях ограничения слишком явные, чтобы кто-то воспринимал “разговорные” возможности гаджетов серьезно. Пожалуй, за исключеним автомобилистов.
  3. Понимание машиной “человеческого языка” — это огромный шаг вперед для популяризации голосораспозавательных технологий. Сейчас говорить об однозначном успехе рано, но результаты интересные. Ведь как классно, засыпая, установить будильник естественной фразой “телефон, разбуди меня в 6:30, а если не проснусь, повтори будильник в 7:00”.
  4. Использование голоса для управления гаджетом не может быть доминирующим способом, а лишь дублирующим основной. Говорить с аппаратом не всегда удобно: посторонним вовсе не обязательно знать про ваши дела с телефоном, а шумная обстановка сильно снижает качество распознавания речи.

Как итог: необычно, интересно, перспективно, но с известным количеством “но”.

* * * *

Хотелось бы увидеть в комментариях результаты ваших экспериментов с голосовыми функциями. Прижились или нет? Удобно лично вам? Считаете, есть ли перспективы в недалеком завтра вовсю болтать с iPhone 7?