(англ. Simulation to Real World), является в настоящее время очень популярной областью исследований.
Часть научного сообщества полагала, что обучение с подкреплением станет ключом к разработке ИИ человеческого уровня. Дэвид Сильвер, капитан команды AlphaGo и представитель компании DeepMind, любит говорить, что «обучение с подкреплением – это суть интеллекта». Столкнувшись с этим «актом веры», некоторые из нас стали пессимистами. Я как-то упоминал «Черный лес», шоколадный торт, состоящий из чередующихся слоев бисквита и сливок, довольно внушительный, покрытый глазурью и украшенный засахаренной вишней. Я часто говорю на лекциях, что если интеллект – это «Черный лес», то бисквит представляет собой обучение без учителя, основной способ обучения у животных и людей, глазурь соответствует обучению с учителем, а вишенка на торте – это… обучение с подкреплением.
Пресловутый здравый смысл
Парадокс искусственного интеллекта заключается в следующем: он очень мощный, он чрезвычайно специализирован, и он … совершенно лишен здравого смысла. «ИИ не наделен понятиями. У него нет культуры. Он ничего не понимает», – напомнил всем Эмманюэль Макрон 29 марта 2018 г., когда представлял доклад об искусственном интеллекте математика Седрика Виллани[120], обладателя медали Филдса и депутата LREM.
ИИ обладает лишь самым поверхностным представлением о мире. Беспилотный автомобиль, который может добраться из точки А в точку Б, не знает, что такое водитель.
Система перевода иногда совершает ужасные ошибки, не имея об этом ни малейшего представления. Виртуальные помощники работают в пределах, определенных их обучением. Они сообщают о пробках, настраиваются на вашу радиостанцию и мгновенно находят песню Жоржа Брассенса, которую вы ищете. Но если вы скажете ей: «Алекса, моя одежда не влезает в мой чемодан, что мне делать?» – она не сможет ответить: «Бери меньше одежды» или «Купи чемодан побольше». Скорее всего, она ответит: «Вот большие чемоданы, доступные на Amazon…». Если вы скажете ей: «Алекса, я уронил свой телефон в ванну», она не будет знать, что ваш телефон намок и его нужно починить. Чтобы ответить с пользой, Алексе понадобится немного здравого смысла, то есть некоторые знания о том, как устроен мир, и о его физических ограничениях.
Нынешнему ИИ не хватает здравого смысла, а здравый смысл очень важен. Он обусловливает нашу связь с миром. Он заполняет пробелы и восполняет неявное. Вспомните, как человек сидит за столом. Мы можем не видеть его ног, но мы знаем, что они у него есть, потому что у нас есть определенные знания о строении тела человека. Вспомним элементарные законы физики. Мы знаем, что, если человек опрокинет стакан, вода выльется на стол. Мы знаем, что, если не держать предмет в руках, он упадет. Мы осознаем время и движение. Когда человек встает, мы знаем, что он больше не сидит, потому что человек не может находиться в этих двух состояниях одновременно.
Из предложения: «Пьер взял свою сумку и вышел из конференц-зала», мы сразу получаем много важной информации. Пьер, наверное, мужчина. Он, скорее всего, на работе. В его сумке наверняка есть документы. Чтобы взять сумку, Пьер делает это рукой, а не ногой, он сжимает пальцы, чтобы поднять ее, он встает со стула (он, скорее всего, сидел, возможно, на совещании), он идет к двери, а не летит, он берется за дверную ручку, поворачивает ее и переступает порог.
С самого начала мы знаем, что другие события невозможны: Пьер не собирается брать свою сумку с помощью психокинеза, он не собирается дематериализоваться, чтобы затем материализоваться за пределами комнаты, он не собирается проходить сквозь стену (если, конечно, он не человек, проходящий сквозь стены) и т. д.
Модель мира, которую мы постепенно усваиваем, – я намеренно использую ту же лексику, что и для искусственного интеллекта – в течение первых месяцев и лет нашей жизни позволяет нам заполнить это весьма банальное предложение массой недостающей информации. Она не дает нам всех сведений, но мы подразумеваем ее, потому что знаем, как устроен мир. Точно так же, когда мы читаем текст, мы можем более или менее предвидеть следующее предложение, а когда мы смотрим видео, мы можем более или менее предсказать последовательность действий и реакций.
В настоящий момент эта способность предсказывать у машин очень ограничена. Конечно, работая с адаптированным текстом, машины могут составить список возможных следующих слов. Но если взять настоящий текст, например, роман Агаты Кристи, и перейти к финальной сцене, где Эркюль Пуаро объявляет: «Следовательно, убийца – сэр …», читателю уже потребуется изрядная доля здравого смысла и знаний человеческой натуры, чтобы суметь закончить предложение. Ни одна машина это не способна.
Наш здравый смысл характеризуется способностью делать выводы. Это позволяет нам определиться в мире и действовать. Моя гипотеза состоит в том, что это – результат другой формы обучения, которую я называю «обучением без учителя».
Эталон человеческого обучения или «обучения без учителя»
На данный момент данное человеческое обучение намного эффективнее, чем любой другой метод машинного обучения.
Психологи, занимающиеся развитием личности, такие как Эмманюэль Дюпу, профессор когнитивных наук в Высшей нормальной школе и по совместительству исследователь в FAIR в Париже, объясняют, что такой тип обучения начинается у нас очень рано[121]. С первых месяцев жизни дети получают много знаний о том, как устроен мир. С двухмесячного возраста они знают разницу между одушевленными и неодушевленными предметами. Они рано понимают, что эти объекты не появляются спонтанно, и что они всегда есть, даже если спрятаны другими. Они приобретают понятие «постоянства». Эти свойства очевидны для взрослых, но изучать их нам приходится в первые несколько месяцев. Интуитивная физика появляется между шестью и восемью месяцами. Спустя девять месяцев малыш осваивает законы гравитации и инерции. Когда он сталкивается с опытом, который нарушает один из этих универсальных законов, его глаза округляются, и можно увидеть его удивление.
Он изучает эти основные понятия благодаря наблюдениям и экспериментам. Еще до того, как научиться ходить, ребенок ведет себя, как ученый. Если в восемь месяцев посадить его на стульчик и поставить игрушки перед ним, он будет поднимать их, бросать, следить за ними глазами, когда те падают, и будет подбирать игрушки, чтобы начать этот процесс сначала. Не ругайте его! Он изучает принцип работы гравитации.
В то же время ребенок развивает способность предсказывать. Это важно для полноты нашего восприятия (у сидящего человека есть ноги, которых я не вижу), но в более общем плане – полезно для прогнозирования последствий наших действий. Это позволяет нам их планировать. Если вы толкнете легкий объект, он сдвинется. Но чтобы пододвинуть тяжелый предмет, потребуется больше усилий.
У нас есть тысяча