В Кремниевой долине началась гонка по созданию лучших искусственных мозгов. Facebook, Google и другие ведущие техногиганты борются за лучших ученых в области искусственного интеллекта и тратят серьезные деньги, чтобы создать компьютеры, думающие подобно людям.
Они не строят человекоподобных роботов — во всяком случае, пока. Но пытаются создать компьютерную систему, которая будет понимать, что вы хотите, еще до того, как вы начнете хотеть.
«Важно позиционировать себя на этом рынке в ближайшие десять лет, — сказал Ян Лекан, ведущий нью-йоркский исследователь, нанятый Facebook в декабре. — Все вертится вокруг искусственного интеллекта, анализа данных и более умных способов взаимодействия людей и компьютеров.
Программы на основе искусственного интеллекта уже могут распознавать изображения и переводить человеческую речь. Инженеры хотят создать системы, которые будут обрабатывать более сложные задачи на уровне человеческого мозга — интуитивно предсказывать условия дорожного движения для беспилотного и автоматизированного транспорта, например, или понимать письменные и речевые сообщения, чтобы на основе их анализа предвидеть, какого рода информация (в том числе и реклама) нужна пользователям.
Facebook наняла несколько хорошо зарекомендовавших себя ученых сферы искусственного интеллекта (в том числе одного из Google) за последние месяцы. Google работает в этом поле уже несколько лет, привлекая видных ученых, чтобы построить компьютерные сети, известные как «нейронные», способные самообучаться.
Вспомним недавнюю сделку, когда Google заплатила 400 миллионов долларов за DeepMind, британский стартап, работающий над искусственным интеллектом для распознавания изображений и прочих интересных вещей. DeepMind также привлек интерес Facebook. В марте CEO Facebook Марк Цукерберг лично инвестировал в Vicarious, стартап Кремниевой долины, работающий над теми же вещами, что и DeepMind.
«За последние полтора года каждый венчурный капиталист, которого я знаю, сделал по крайней мере одну инвестицию в область искусственного интеллекта, робототехники или смежные отрасли, — рассказал Радж Сингх, гендиректор компании Tempo AI, которая делает приложение «умный календарь», работающее а-ля личный ассистент. Tempo использует технологию SRI, которая легла в основу Siri от Apple и породила несколько стартапов этой же сферы.
Конкуренция среди цифровых персональных ассистентов нагревается. Все работают по-разному — и Siri, и Google Now, и Cortana от Microsoft. Каждый пытается превзойти другого, анализируя данные все лучше и лучше.
Конечная цель — что-то близкое к Саманте, персональной операционной голосовой системе, озвученной Скарлетт Йохансон в фильме «Она», однако более деловой ее вариант.
Сейчас даже фанаты Siri выражают разочарование в связи с ее ограничениями. Однако есть признаки того, что Apple лихорадочно пытается улучшить своего ассистента.
«Apple нанимает самых умных ребят в этой сфере, — говорит Абдель-Рахман Мохамед, ученый из Университета Торонто. Он предполагает, что Siri будет значительно улучшена в скором времени.
Тем временем Facebook хочет лучше анализировать посты своих пользователей и их предпочтения, чтобы показывать им более релевантную рекламу. Компания работает над улучшением алгоритмов распознавания лиц для фототегирования. Цукерберг также намекнул, что он хочет конкурировать с Google в предоставлении ответов на пользовательские вопросы, опираясь на рекомендации и замечания 1,2 миллиарда пользователей социальной сети.
«Цель заключается в использовании новых подходов в области искусственного интеллекта, чтобы наделить смыслом весь контент, которым делятся люди, и ответить с его помощью на их же вопросы, — недавно рассказал Цукерберг. — Потенциал огромен, на самом деле».
Google целится туда же. Туда же целятся Microsoft, Yahoo, Baidu и другие компании. IBM вложила более миллиарда долларов в свой Watson, искусственный интеллект которого позволяет побеждать даже в аналоге «Своей игры» — Jeopardy.
Google уже использует свой искусственный интеллект для улучшения голосового поиска и Google Now, а также самоуправляемых автомобилей. Хотя Google не обсуждает детали своих проектов, Ларри Пейдж явно показал свой энтузиазм на технологической конференции TED в марте.
«Думаю, мы наблюдаем за работой, которая переплетает информатику и неврологию, пытаясь сделать что-то действительно умное, — сказал Пейдж. Он показал видео проектов Google и DeepMind, где компьютерные системы учились распознавать котов и играли в игры.
Google и Facebook обе надеются вынести больше из «глубокого обучения», технологии, благодаря которой компьютерные сети самообучаются, анализируя большие объемы данных, а не полагаются на программистов, которые говорят им, что обозначает каждый рисунок. Такие сети решают проблемы, разбивая их на несколько шагов, подобно слоям нейронов, работающих в наших головах.
Впервые этот подход был изобретен в 80-х годах горсткой ученых, включая Хинтона и Лекана. Но ученые говорят, что его потенциал взорвался в последние годы, поскольку у них появился доступ к более мощным вычислительным системам и крупным объемам данных.
Эта технология может помочь компаниям создавать системы, не ограниченные распознаванием слов или фраз, понимающие смысл печатных и разговорных фраз. Чтобы не гуглить прогноз погоды, а можно было просто спросить: «Нужен ли мне сегодня зонтик?».
Также это может помочь компаниям вроде Google и Facebook анализировать индивидуальные сообщения и предпочтения клиентов, чтобы подгонять под них рекламу. Отметим также, что кроме Google и Facebook, едва ли это кому-нибудь интересно.
Мощный искусственный мозг, который знает ваши предпочтения и привычки, может быть пугающим, признает Мохамед, поэтому без этики и конфиденциальности в его разработке не обойтись.
Эксперты утверждают, что, безо всяких сомнений, искусственный интеллект будет широко использоваться. В ближайшее время интеллектуальные «ассистенты» будут встраиваться в каждый второй гаджет и сервис.
Среди основных путей развития искусственного интеллекта отмечают следующие цели и технические методы. Вот над чем работают компании в данный момент:
— распознавание речи, или способность переводить разговорную речь в компьютерные команды;
— распознавание изображений, или способность распознавать визуальные представления объектов;
— обработка естественного языка, или способность определять смысл и цель письменных текстов и разговорной речи, понимая их задачу, даже если они не содержат конкретных условий поиска.