руководителя FAIR, чтобы стать главным специалистом компании по ИИ. Я отказался от оперативного управления и вернулся к исследованиям и технологической стратегии. Мое решение объясняется целым рядом причин. Во-первых, организация значительно выросла. Наряду с FAIR нам пришлось создать отдельную организацию, занимающуюся прикладными исследованиями и отвечающую за передачу новых разработанных методов для их практической реализации.
Эта новая организация была объединена с FAIR под общей крышей, так что они теперь могут взаимодействовать очень тесно.
Лично я считаю себя больше творческим мечтателем, чем руководителем. Создать проект, направить его в нужное русло – это, конечно, хорошо, но заниматься всем остальным – уже не моя история. Я решил передать свои полномочия в другие руки.
Руководство FAIR теперь составляют два человека – Антуан Бордес из Парижа, бывший руководитель FAIR в Париже, и Жоэль Пино из Монреаля, бывший руководитель FAIR в Монреале, а также профессор Университета Макгилла. Руководителем ИИ компании Facebook, курирующим FAIR и группу прикладных исследований FAIAR, является Жером Песенти. В этой организационной структуре я вместе с Жеромом отвечаю за научное и стратегическое направление.
Глава 9
Что ждет нас завтра? Перспективы и проблемы искусственного интеллекта
На сегодняшний день даже самые лучшие системы ИИ все еще очень ограничены. По уму они уступают кошке, мозг которой содержит 760 млн нейронов и 10 000 млрд синапсов. Не говоря уже о ее «двоюродной сестре» собаке, в мозге которой 2,2 млрд нейронов. Мы не можем проектировать и строить машины, которые по мощности даже приближались бы к человеческому мозгу, с его 86 млрд нейронов и потребляемой мощностью около 25 Вт. Из главы 1 нам известно, что даже если мы понимаем принципы обучения в мозгу, даже если мы понимаем его структуру, вычислительная мощность, необходимая для воспроизведения его функционирования, оказывается гигантской – порядка 1,5 × 1018 операций в секунду. Сегодняшняя видеокарта способна выполнять лишь 1013 операций в секунду и потребляет около 250 Вт. Чтобы получить мощность человеческого мозга, вам придется подключить сотню тысяч таких процессоров к гигантскому компьютеру, потребляющему не менее 25 мегаватт; это в миллион раз превышает потребности человеческого мозга. Исследователи ИИ в Google и Facebook имеют доступ к вычислительным мощностям такого порядка, однако сложно заставить несколько тысяч процессоров работать одновременно над одной задачей.
Научная проблема здесь велика. Технологическая проблема тоже.
Мы неустанно работаем над расширением границ существующих систем. Какие возможности наиболее перспективны? Чего нам ожидать от будущих исследований?
Природа вдохновляет, но лишь до определенного момента
Во Франции все слышали о Клемане Адере, пионере французской авиации. Репродукция его самолета Avion-III вызывает восхищение у посетителей Музея искусств и ремесел в Париже. Клеман Адер жил в конце XIX века. Еще за 13 лет до братьев Райт, в 1890 г., этот гениальный мастер построил самолет, который совсем немного оторвался от земли. Но никто не знает его имени за пределами Франции.
Почему? Да потому что за его работами никто не следил, да и мало кто видел его изобретение. Самолет Адера действительно летал, но оказался неуправляемым. Моделью для него послужила летучая мышь, но изобретатель не подумал о проблемах с маневренностью и устойчивостью, которые создавала его машина. Желая воспроизвести природу, он сбился с пути. Еще одна проблема: этот пионер авиации был человеком скрытным и дерзким. Вместо того чтобы выставлять свои работы, он показал их лишь горстке людей. Отсутствие очевидцев даже заставляет историков сомневаться в правдивости его достижений.
Эта история без будущего хорошо иллюстрирует мою точку зрения. Засекреченные эксперименты ни к чему не приведут. Об исследованиях нужно говорить, ведь они подпитываются обменами информацией. Они должны быть открытыми. Я убедился в этом, работая в Bell Labs, и пользовался тем же принципом в FAIR. С другой стороны, воспроизведение биологии без понимания принципов ее работы часто приводит к фиаско. Вместо этого мы должны выявить главное в естественных механизмах, которые мы пытаемся воспроизвести.
Мы много говорили о знаменитом научном дуэте Хьюбела и Визеля, а также о нейробиологах, которые начали расшифровывать человеческий мозг. Они и вдохновили первых исследователей искусственного интеллекта. Искусственный нейрон был непосредственно вдохновлен нейроном в головном мозге, так же как крыло самолета вдохновлено крылом птицы. Сверточные сети имитируют определенные аспекты архитектуры зрительной коры. Однако ясно, что будущее исследований ИИ не может быть сведено к бездумному копированию природы.
На мой взгляд, мы должны искать основы интеллекта и обучения, будь то биологический интеллект или электронный. Подобно тому, как аэродинамика объясняет полет самолетов, птиц, летучих мышей и насекомых, и как термодинамика объясняет преобразование энергии в тепловых двигателях и биохимических процессах, теория интеллекта должна отражать интеллект во всех его формах.
Пределы машинного обучения: обучение с учителем
Обучение с учителем, наиболее часто используемое в ИИ, является лишь слабым отражением принципа обучения людей или животных. Оно основано на архитектуре, параметры которой постепенно корректируются для решения поставленной задачи. Но чтобы научить систему распознавать объекты, ей потребуются тысячи или даже миллионы изображений таких объектов.
Кроме того, примеры необходимо сначала идентифицировать и пометить вручную. Компании используют армии аутсорсеров, чтобы маркировать изображения, переводить текст с одного языка на другой и производить данные, необходимые для обучения таких систем. Этот процесс стал настолько распространенным, что Accenture, международная консалтинговая группа, уже предлагает именно такие услуги многим компаниям, использующим машинное обучение. В академических исследованиях часто используется платформа AMT (Amazon Mechanical Turk), услуга, предлагаемая Amazon, с помощью которой любой может войти в систему, чтобы выполнять маркировку объектов и получать деньги.
Обучение с контролем очень эффективно, когда данных достаточно. Но у него есть свои пределы. Оно работает лишь в пределах заданной области и оставляет «слепые зоны». В качестве доказательства я беру так называемые «состязательные» изображения, которые для глубокого обучения представляют собой то же самое, что и оптические иллюзии для людей. Эти заведомо идентифицируемые изображения могут легко заставить машину ошибиться. Эксперименты показали, что незначительное изменение дорожного знака «стоп» может привести к тому, что некоторые нейронные сети уже не смогут его обнаружить. Это уже причина беспокоиться о безопасности автономного вождения. В принципе, можно ввести в заблуждение и людей-водителей, замаскировав дорожные знаки, но почему такая маскировка опаснее для беспилотных автомобилей?
Давайте посмотрим, как это работает, на примере. Рассмотрим ИИ-приложение, которое различает кошку и тостер. Можно незаметно заменить изображение кошки на изображение человека, но машина оценит эту подмену как «тостер», причем с высоким баллом надежности. Чтобы этого добиться, нам достаточно показать изображение кошки машине и поменять пиксели этого изображения так, чтобы увеличить