AlphaZero и революция знаний

ПРЕДИСЛОВИЕ ГАРРИ КАСПАРОВА

Древняя настольная игра в шахматы сыграла значительную роль в истории искусственного интеллекта, хотя и в основном как химера. Отцы-основатели вычислений, такие как Алан Тьюринг и Клод Шеннон, понимали, что простой алгоритм может неплохо играть в игру, что было продемонстрировано Тьюрингом и Дэвидом Чамперноуном в программе «бумажная машина» в 1948 году.

Поскольку первые компьютеры были очень медленными, они также предполагали, что для того, чтобы когда-либо бросить вызов людям-гроссмейстерам, машина должна будет подходить к шахматам как человек, используя избирательные алгоритмы, основанные на знаниях. Грубая проверка каждого возможного хода — миллионы вариантов всего за несколько ходов — явно была слишком медленной.

Конечно, эти светила не могли знать, что скорость компьютерной обработки скоро начнет расти в геометрической прогрессии с появлением интегральных схем. Гордон Мур постулировал свой одноименный Закон только в 1965 году, через двенадцать лет после трагической и трагически преждевременной смерти Тьюринга.

Несмотря на то, что в жестких ограничениях сонета или хайку может быть великая красота, ограничения первых компьютеров вынуждали программистов проявлять творческий подход и экспериментировать. Они решали вопросы ИИ, которые были намного шире, чем скромная игра, которую они пытались победить. Может ли программа учиться на своих ошибках вместо того, чтобы каждый раз повторять одни и те же ошибки? Можно ли привить машине интуицию? Что имеет значение при определении интеллекта или метода? Если человеческий мозг — это просто очень быстрый компьютер, что происходит, когда компьютеры становятся быстрее мозга?
 
Кроме того, интересна роль шахмат как символа в распространении Вычислительной теории разума (ВТЗ). К 1997 году компьютерная публика не была удивлена тем, что Deep Blue может играть в шахматы на уровне чемпиона мира. Они были поражены тем, что человек может конкурировать с машиной в преследовании, которое большинство считает упражнением в расчете. Мне приписывали сверхчеловеческие, «компьютерные» способности, тогда как на самом деле считалось, что человеческое мастерство в шахматах основано больше на распознавании образов и пространственной визуализации, чем на счете или других сильных сторонах компьютера.

К сожалению, оказалось, что ответы на все эти глубокие вопросы не нужны для создания машины, которая победит чемпиона мира по шахматам. Еще в конце 1970-х все лучшие программы были построены по одной и той же модели: машина Шеннона «Тип А», которая использовала поиск методом грубой силы, минимаксный алгоритм и всю скорость, которую могли обеспечить процессоры того времени. Сообщество программистов обрадовалось быстрому прогрессу в силе, но разочаровано той прямолинейностью, с которой он был получен. Это было так, как если бы цель построить робота-альпиниста, способного покорить Эверест, была достигнута с помощью гигантского танка, преодолевающего прямую линию к вершине. Когда в 1983 году аппаратная машина Кена Томпсона Belle достигла уровня мастерства, запись была на стене — даже если многие из нас будут отрицать это еще десять лет. Это делается не для того, чтобы принизить достижения команды Deep Blue или поколений блестящих шахматных программистов и изобретателей, которые были до них, а только для того, чтобы оценить их с точки зрения ретроспективы. Это важный урок: наши первоначальные представления часто далеки от истины, когда мы сталкиваемся с прагматичными результатами, которые дают машины. Нашим интеллектуальным машинам не нужно подражать нам, чтобы превзойти нашу производительность. Они не должны быть идеальными, чтобы быть полезными, они должны быть лучше человека в конкретной задаче, будь то игра в шахматы или интерпретация снимков рака.

Когда эпоха противостояния человека и машины подошла к концу, в 1998 году я создал Advanced Chess, чтобы исследовать потенциал человека и машины. В очередной раз шахматы оказались удобной лабораторией для экспериментов, которые имели гораздо более широкое применение. Открытие состояло в том, что превосходный процесс координации между ними был важнее, чем сила человека или машины. Эта формула, очевидно, имеет срок годности в небольшой закрытой системе, такой как шахматы, где машины постоянно совершенствуются, но акцент на улучшении интерфейсов и процессов совместной работы стал общепринятым в открытых, реальных областях, таких как анализ безопасности, инвестирование и т.д. и программное обеспечение для бизнеса.
 
К 2017 году рейтинги топовых шахматных программ были для Магнуса Карлсена тем, чем Карлсен является для сильного клубного игрока. Они используют гигантские дебютные книги, терабайты таблиц финальных игр и многоядерные процессоры, которые делают ваш iPhone быстрее, чем Deep Blue. Трудно было представить, что мои любимые шахматы могут предложить что-то еще в своей прежней роли лаборатории познания, и программисты игр с искусственным интеллектом перешли к видеоиграм и го, более сложной математически игре для машин.

На самом деле именно программа Го привела к возвращению шахмат в центр внимания ИИ. AlphaGo от DeepMind вышла за рамки чистой грубой силы, чтобы конкурировать и побеждать лучших игроков в го в мире. Тогда больший сюрприз, генериc под названием AlphaGo Zero, легко превзошла своего великого предшественника, отказавшись от встроенных человеческих знаний и научившись играть лучше, играя против себя. Увидев этот важный результат, мне, конечно же, пришлось спросить Демиса Хассабиса из DeepMind, когда он собирается обратить внимание своей машины на нашу любимую игру. Люди и машины относительно плохо разбираются в Го из-за его сложности. Много ли можно было улучшить в шахматах? Сможет ли алгоритм-самоучка конкурировать с лучшими традиционными программами после десятилетий вложения в код как можно большего количества человеческих шахматных знаний?

Как мы теперь знаем и как подробно описано в этой книге, ответом было громкое «да». AlphaZero доминировала против сильнейшей в мире традиционной программе Stockfish 8 в двух матчах, несмотря на то, что рассчитала гораздо меньше позиций.
 
Сила AlphaZero впечатляет, но его метод гораздо важнее. AlphaZero не просто применяет человеческие знания и анализирует миллиарды позиций для создания ходов — сначала он создает собственные знания. И, судя по его результатам и моим наблюдениям, знания, которые он генерирует для себя, уникальны и превосходны. Мы не просто получаем более быстрые результаты, как с помощью калькулятора. Вместо открытки из далекой страны это телескоп, который может позволить нам увидеть все своими глазами.

И хотя шахматный стиль вряд ли представляет большой интерес для поклонников ИИ, я был очень рад увидеть динамичный, жертвенный стиль AlphaZero. Не только потому, что она отражал мой собственный, но и потому, что она могла так играть и побеждать против устрашающе точной элитной программы. Вместо того, чтобы перемалывать шахматы в пыль утомительным и непонятным маневрированием, AlphaZero предпочитает фигурную активность и атакующие возможности.
 
Конечно, машина-самоучка не использует подобные человеческие эвристики, хотя мы не можем не использовать их сами, говоря о ее игре. Она не мыслит категориями жертв или чего-то еще. Это просто воспроизведение того, что работает лучше всего, как и любая другая программа. Разница заключается в пути, который необходимо пройти, чтобы добраться до цели, и в объективном превосходстве результата. Вместо предубеждений вековых человеческих шахматных знаний AlphaZero выделяет самое важное за считанные часы.

Одним из прозвищ великого Капабланки было «Шахматная машина», что отражало его непобедимую последовательность. Возможно, в будущем AlphaZero тот, кто играет «как шахматная машина», будет больше похож на Алехина, с ослепительными жертвами и любовью к неуравновешенным позициям!

Влияние такой системы в других областях трудно переоценить — опять же с той оговоркой, что шахматы — это закрытая система, где вся информация известна, и никакая новая информация не может быть введена. Тем не менее, виртуализация данных — это огромный путь. AlphaZero не нужно кропотливо анализировать миллионы человеческих игр, когда она может сыграть против себя больше игр за несколько часов, чем когда-либо было зарегистрировано в истории человечества.

Одно из следствий заключается в снижении превосходства сбора данных и знаний, созданных человеком, особенно в закрытых системах и элементах открытых систем, которые можно эффективно разбить на закрытые. Например, беспилотные автомобили Google проехали миллионы миль по дороге, но виртуально — миллиарды миль. Tesla нанимает цифровых художников и дизайнеров видеоигр, чтобы улучшить моделируемую среду вождения, в которой они тренируют свой автопилот. И хотя это не идеальная замена реальной вещи, симуляции будут только улучшаться, а их скорость только увеличиваться.

По мере того, как машины станут умнее, нам придется преодолеть нашу паранойю и предрассудки. Это следующий этап сотрудничества человека и машины, чтобы признать, что машинные знания и суждения могут превосходить наши собственные. Вместо того, чтобы просто использовать машины в качестве инструментов — модель «кентавра» — машины становятся экспертами, а люди будут присматривать за ними — я называю это моделью «пастух».

Системы машинного обучения, такие как AlphaZero, несовершенны, и это, пожалуй, самый трудный для преодоления предрассудок — наше требование, чтобы наши машины были полностью свободны от ошибок, а не просто превосходили их. Например, исследования показывают, что люди предпочитают диагноз, поставленный доктором-человеком, а не компьютеру, даже если им говорят, что машина более точна.
 
Это не совсем иррационально, поскольку будут редкие случаи, когда системы ИИ не смогут обнаружить исключения из своих правил, в то время как люди могут мыслить творчески и адаптивно. И мы не должны недооценивать силу эмпатии и важность отношений между людьми во всех аспектах построения лучшего общества. Технологии — это средство для достижения цели, а не цель. Люди также склонны к догматическим слепым пятнам и отсутствию объективности, поэтому мы должны позаботиться о том, чтобы наши предубеждения не передавались нашим цифровым творениям. Нет особого смысла в создании искусственного интеллекта, который только быстрее совершает те же самые ошибки.

AlphaZero потряс шахматы до основания, но это лишь крошечный пример того, что нас ждет впереди. Измочаленные дисциплины, такие как образование и медицина, также будут потрясены, хотя и медленно, улучшенными результатами, обещанными анализом ИИ, если мы им это позволим. Даже если AlphaZero снова выглядит концом пути для шахмат как предмета исследования машинного познания, я очень рад видеть, к чему это приведет.

Гарри Каспаров, Нью-Йорк, декабрь 2018 г.

Источник: Game Changer AlphaZero’s Groundbreaking Chess Strategies and the Promise of AI (Matthew Sadler, Natasha Regan)


Рецензии