Боковой амиотрофический склероз и другие схожие расстройства нервной системы препятствуют общению и социализации людей, страдающих от них. На определённой стадии БАС человек не может даже говорить, но у него остаётся возможность управлять глазами. Именно это дало возможность великому учёному Стивену Хокингу, страдающему от БАС большую часть своей жизни, не только общаться с близкими и создать семью, но и продолжить свою работу. Управляя глазами Стивен Хокинг буквально взглядом набирает текст с помощью специальной системы, которая встроена в его кресло. Затем с помощью специальных алгоритмов текст переводится в синтетическую речь. Такая система очень дорогая и сложная, поэтому она доступна лишь избранным, поэтому небогатым людям с БАС приходится использовать обычную доску с буквами и специально обученных людей для общения. Но стажёр Microsoft Research Ксяой Джанг предлагает использовать для аналогичного общения смартфоны, которые в наше время стали доступными и повсеместными устройствами. Для этого он совместно с коллегами разработал приложение GazeSpeak.
Принцип работы GazeSpeak такой же как и у доски с буквами, но роль специально обученного человека выполняет смартфон со специальными алгоритмами. С помощью задней камеры смартфона и специальной наклейки с алфавитом на заднюю панель приложение GazeSpeak помогает вводить текст одним лишь взглядом. При этом специально обученный искусственный интеллект упрощает такой способ ввода текста благодаря подсказкам: четыре наиболее подходящих слова отображаются на экране смартфона. Такой подход позволяет ускорить ввод одного предложения до 78 секунд в среднем. Для сравнения, средняя скорость ввода одного предложения с помощью специальной доски и обученного человека составляет 123 секунды.
Конечно, GazeSpeak в текущем варианте не является идеальным способом общения людей с БАС, но сообщество может его совершенствовать и развивать. Ведь Ксяой Джанг планирует разместить исходный код приложения в открытом доступе. Также GazeSpeak появится в ближайшее время в магазине приложений AppStore для iPhone. Надеемся, что энтузиасты воспользуются наработками Ксяоя и выпустят аналогичные приложения для других платформ, а также сделают возможным ввод на языках с отличным от латинского алфавитом. Возможно, некоторые из них даже будут работать с фронтальной камерой на некоторых устройствах. Больше информации о GazeSpeak появится на специальной презентации Conference on Human Factors in Computing Systems, которая пройдёт в мае в Колорадо.