Теоретико-игровое чтение Бэтмена: Темный рыцарь

(Некоторые спойлеры ... но вы видели фильм, верно?)

Одно недавнее обсуждение с одним из моих советников подняло тему перехода теории игр в кино. Это побудило меня задуматься о том, какие фильмы демонстрируют типичную теоретико-игровую ситуацию, когда игроки действуют конкурентно (или совместно) и получают отдачу от своих действий. Если это звучит абстрактно, позвольте мне представить эту идею в книге «Темный рыцарь», основанной на теории игр.

Зная другого

Прежде чем мы начнем, давайте подготовим почву для предстоящего обсуждения. Ситуация может быть написана с точки зрения теории игр, если два (или более) игрока принимают решения, которые влияют на благосостояние других игроков. Вспомните классический пример «Битвы полов», где в (устаревшей) версии проблемы мужчина хочет присутствовать на поединке по боксу, а его партнерша предпочла бы пойти в Оперу. Предположим, что у них нет средств общения до событий и что они наслаждаются вечером, если их разлучить (то есть один идет на матч по боксу, а другой - в Оперу). Тогда наши два игрока сотрудничают (потому что хотят провести ночь вместе) и соревнуются (потому что у них разные предпочтения по сравнению с активностью): именно здесь начинается теория игр.

Таким образом, центральный вопрос теории игр состоит в том, откуда мне знать, что решит сделать другая сторона? Это кажется разумным вопросом, если я хочу получить максимум удовольствия от вечера. Если я знаю, что мой партнер определенно собирается в Оперу, я тоже должен уйти в отставку, хотя я бы предпочел увидеть матч по боксу. Но здесь есть одна загвоздка: моя партнерша (если она будет рациональна до некоторой степени, об этом позже) делает то же самое! Мы оба строим модель того, что думает другой. И неизбежно, эта модель должна содержать тот факт, что другой пытается предвидеть мои действия. Который сам содержит тот факт, что я ожидаю ее действий. И т.д. И т.д. Я думаю, что вы думаете, что я думаю, что вы думаете ... и мы продолжаем.

Темный Рыцарь, однако, не начинает с такой абстрактной экспозиции, хотя и близко. В прекрасно отредактированном ограблении банка, возглавляемом (на данный момент) загадочным лидером, команда гангстеров приступает к опустошению сейфа. Понятно, что они собираются делиться добычей, но вскоре они начинают поворачиваться друг к другу, чтобы уменьшить количество сторон, участвующих в сделке. Гангстер D получил инструкцию стрелять в Гангстера Е. Но Гангстер С получил ту же инструкцию, только его цель - его Гангстер D. И это поднимается до главной собаки, Гангстера А, которая оказалась неуловимым Джокером, покидая сцену со всем сокровищем ,

Его миньоны могут быть хорошими гангстерами, но они явно составляют ужасную команду теоретиков игры. Ставя себя на место Гангстера С, собираясь застрелить Гангстера Д после того, как стал свидетелем его собственного убийства Гангстера Е, как мне не ожидать, что Гангстер Б получил подобные инструкции? Если бы я позволил своим рассуждениям пойти еще дальше, я мог бы избежать смерти с помощью когнитивной модели Гангстера В (что, я думаю, он сделает). Джокер, с другой стороны, является исключительным теоретиком игры, потому что он, очевидно, не верил, что его люди пойдут на дополнительный шаг. Действительно, лучший теоретик игры знает, что эти предположения о рациональности (предполагая, что я буду думать о том, что мой оппонент думает обо мне и т. Д.) В действительности очень быстро проваливаются, особенно когда большие денежные выгоды размывают ваше мышление. Что приводит нас к игре «Диктатор».

Человечество: слишком мило!

Игра «Диктатор» не совсем игра сама по себе, но ее анализ с точки зрения теории игр интересен. Есть два игрока, хотя игрок два не может действовать никак. Первый игрок - единственный, кто принимает решения, и ему поручено разделить 100 долларов между двумя из них. Легкая проблема, если взглянуть на это с помощью теории игр: возьми деньги! Все это! Это равновесие по Нэшу: в этом случае никто не хочет менять свое действие. Первый игрок получит меньше, если даст больше второму игроку, а второй в любом случае не сможет договориться.

Ну, это теория. На практике, наблюдаемые в реальных экспериментах, проведенных с реальными людьми и реальными деньгами, деньги делятся, но не одинаково. Первый игрок обычно предлагал себе больше, чем ее справедливая доля, а второй игрок уходил домой со строго положительной суммой денег. А? Если мы исключительно доверяем равновесию Нэша, чтобы дать нам решение игры, ну, эти игроки потерпели неудачу. Иррациональные существа! Это, конечно, не учитывает веса социальных норм, в которых люди имеют некоторое представление о справедливости. Это все относительно, конечно, и есть много способов определить это.

В большинстве случаев теоретики игр, как правило, используют систему социального обеспечения как показатель эффективности работы системы. Мы суммируем выплаты наших игроков и посмотрим, можно ли увеличить эту сумму с помощью другого выбора действий. В игре «Диктатор» это не приводит ни к какому хорошему понятию справедливости, так как игра с нулевой суммой (все, что получает игрок, это то, что не получает игрок два). Таким образом, социальное обеспечение неизменно будет составлять 100 долларов. Здесь может быть более подходящей мера социального успеха нашего выбора: срок действия. Здесь мы определяем как социальное обеспечение минимальную сумму, полученную всеми игроками. В сценарии «игрок держит все» социальное обеспечение makepan буквально наихудшее: 0 долларов, то есть то, что получает второй игрок. Чтобы максимизировать наше социальное обеспечение, мы лучше найдем способ для игроков договориться о разделении на пятьдесят на пятьдесят.

Но философия Джокера другая. В своих извращенных играх на протяжении всего фильма он будет пытаться доказать с научной точностью, что большинство людей не являются добродушно настроенными людьми, наделенными справедливостью, как они думают. В ограблении банка, в игре-диктаторе, в которую играют многие игроки, Джокер идет прямо к Нэшу: он на вершине, получает собственную прибыль и выбирает ее как целую социальную лепешку. Для экономиста ирония особенно остра: Джокер на самом деле является прототипом человека-экономиста, рационального зверя, который всегда действует в своих собственных интересах. Так много для безумного клоуна с зелеными волосами. Эта аналогия может быть полезна для снижения веса, который рациональный агент налагает на микроэкономическую теорию ...

Цыпленок на лодках

Джокер не только обладает замечательной интуицией теории игр, но и могучим экономистом-экспериментатором. То есть, если комитет по этике его учреждения разрешает проводить эксперименты на жизнь или смерть с участием людей на лодках, ожидающих взрыва. Это сцена, которая удивительно похожа на игру «Цыпленок», уже изображенную в классическом «Повстанце без причины», только намного более смертоносную.

В Готэмском заливе ходят два парома. На одного из них садятся «обычные» люди (мужчины, женщины, дети), а пассажиры другой лодки - заключенные в оранжевом комбинезоне. Между лодками есть одна общая черта: у обоих достаточно взрывчатки, чтобы взорвать всех на борту. Каждый паром получает детонатор, который активирует взрывчатку на другом транспортном средстве. Дополнительное правило: если никто не взорвется в течение переданного времени, оба взорвутся.

Гомоэкономик бросился бы на кнопку в надежде взорвать другую лодку первым. Это то, что Джокер хотел бы доказать, свою гипотезу. Но наши неудачливые игроки размышляют над вопросом, в какой странной игре на голосование выясняется, что будет делать кто. В том, что кажется аргументом в защиту тезиса Джокера, лодка не заключенных начинает объявлять, что, возможно, они должны считать заключенных более достойными быть взорванными. Баланс справедливости серьезно сказывается на их стороне, так что это звучит как разумный вариант. Между тем, на другой лодке, в типичный голливудский момент, один из заключенных берет пульт и выбрасывает его в воду. Если не заключенные решат нажать кнопку, они получат возможность жить согласно правилам. Если они этого не сделают, никто не будет. Но их шансы никогда не были лучше.

Но о! иррациональность. Опять же, снова бросая вызов всей логике и теории и приводя в бешенство Джокера, который, вероятно, думал, что его искусное доказательство его гипотезы получит ему по крайней мере публикацию в Науке, не заключенные оказываются неспособными нажать кнопку. Хотя это доминирующая стратегия! Так расстраивает.

Несколько заключительных слов

Темного Рыцаря часто можно увидеть по линии Добра против Зла, и как эти линии слишком легко стираются. Здесь мы предлагаем альтернативное объяснение: иррациональное (или человеческое) и рациональное. Интересно, что другое понятие теории игр, получившее название Price of Anarchy, стремится количественно определить разрыв между ситуацией, когда каждый игрок заботится исключительно о своем собственном благополучии, и ситуацией, когда социальное обеспечение в целом максимизируется. Джокер очень хотел бы дать буквальное значение этой Цене Анархии, позволяя эгоистичным действиям его невольных подданных развиться до их (теоретического) заключения: хаоса. Но вы всегда можете рассчитывать на то, что наши совершенно иррациональные перочинители возмущают шоу…