Евгений Серебряный
К.ф.-м.н. Теоретическая и математическая физика
Science
5 мин. на чтение

ТЮРЕМНЫЙ ПОКЕР: наука или удача?

ТЮРЕМНЫЙ ПОКЕР: наука или удача?
Поделиться материалом

Теория игр в виде, близком к сегодняшнему пониманию, возникла одновременно с теорией вероятности в эпоху Возрождения. Вначале это было учение о выборе оптимальной стратегии в азартных играх. Такими задачами занимались Дж. Кардано, Г.Галилей и Б.Паскаль. Хотя первые нетривиальные приложения отмечены еще в Торе, в задаче о разделении наследства (см. Р. Ауманн «Экономика Талмуда»). Р. Ауманн — лауреат Нобелевской премии по экономике 2005 г. «за вклад в исследования возникновения конфликтов и кооперации с точки зрения теории игр». 
Публикуем популярное изложение стратегии одной азартной игры на основании материалов лекций д-ра ф.-м. наук А.Савватеева.

Игра выглядела незатейливо и безобидно — один выигрывает ровно то, что проигрывает другой

Осенью 19.. г.  я возвращался в Киев после долгого утомительного сплава по таежной речке. В то время, благодаря президентской амнистии, к гражданской жизни возвращалось множество мужчин, закаленных в местах отдаленного выживания. В моем соседе по купе безошибочно угадывался «зк» — по повадкам и взгляду темных глаз — одновременно бесшабашному и тяжелому.

Поезд тронулся, мы разговорились — без подробностей. В какой-то момент он спросил: «Ну а чем по жизни занимаешься?» «Я математик. Занимаюсь теорией игр». «О! Чайку и сыграем?!»

Игра выглядела незатейливо и безобидно. Два игрока делают ставку — один на чет (Ч), другой на нечет (НЧ). Оба одновременно и независимо выбрасывают 1 или 2 пальца. Если сумма (не)четная — победил тот, кто ставил на (не)чет. Игра была «с нулевой суммой» — один выигрывает ровно то, что проигрывает другой. Выигрыш распределялся следующим образом:

Ч / НЧ

1

2

1

2,-2

-3,3

2

-3,3

4,-4

Выглядит понятно. Например, ты за четных — левый столбец, первые цифры очков в клетках. Если в сумме выпало два пальца — получи 2 очка (тогда в ходу были рубли, но это не важно), если четыре пальца — то 4. А если сумма нечетная, извини, с тебя трешка.  

Отказаться я не мог, но и полагаться на удачу казалось непрофессиональным. Пока несли чай, я лихорадочно пытался определить выигрышную стратегию. Положим, противник выбирает ходы по какому-то алгоритму — с вероятностью p выбрасывает 1 палец и с вероятностью (1-p) — 2 пальца. Тогда, если я выбираю 1 палец, средний выигрыш согласно 1-й строки матрицы составит:

Ч(1) = (+2)*p + (-3)* (1-p) = 5*p -3

Если же я показываю 2 пальца, то из второй строки матрицы находим

Ч(2) = (-3)*p + (+4)* (1-p) = -7*p + 4

Конкретный выбор 1 или 2 пальцев математики называют «чистой» стратегией, а если игрок делает разные ходы с какими-то вероятностями — это смешанная стратегия. Результат зависел от вероятности p. Если p мало, пусть нуль, то есть, он все время выбрасывает 2 пальца, то лучшей будет чистая стратегия «2 пальца» с выигрышем Ч(2) = 4. Если же p максимально, = 1, то выигрышной будет стратегия «1 палец» с результатом Ч(1) = 2. Но ведь противник не станет терпеть проигрыш, он изменит стратегию, а мне придется подстраиваться. Все усложнялось.

Я сказал, что должен ненадолго зайти к друзьям в соседнем вагоне. Тусклая лампочка в тамбуре едва позволяла видеть заметки в походном блокноте. Вагон шатало, стоял острый запах креозота и было сложно закончить анализ незатейливой игры. В теории игр есть понятие равновесия. Это такая пара стратегий обеих игроков, что ни одному из них не выгодно поменять свою. Уже было ясно, что равновесия с чистыми стратегиями нет. Это было бы хаотическое угадывание хода противника.

Подумав, я понял, что единственная возможность для противника обезопасить себя — выбрать вероятность p так, чтобы от моего хода ничего не зависело. То есть, чтобы: Ч(1 палец) = Ч(2 пальца) — если уравнение имеет решение.

Отсюда оптимальная вероятность для игрока, ставящего на нечет выбрасывать 1 палец: p(1 палец)= 7/12. Аналогично станет рассуждать и четный игрок. И постарается выбрать и для себя ту стратегию, которая обезопасит его от смены стратегий противником. Такой же расчет даст для него тот же результат (это не всегда так). Итого, оптимальная пара вероятностей для каждого из игроков:

P(1 палец) = 7/12, P(2 пальца) = 5/12. То есть, немного чаще нужно показывать 1 палец. 

В этот момент распахнулась дверь тамбура. Упираясь руками в раскачивающийся дверной проем, на меня глядел сосед по купе. «Как, держишь равновесие? — спросил он с ухмылкой — Идем, продолжим». Молча мы вошли в купе и сели друг напротив друга. «Мне нужно еще пару минут. — сказал я. — Извольте.»

Я подставил найденные оптимальные вероятности в функцию выигрыша и сосчитал, что в среднем в равновесии игрок, делающий ставку на «чет», проигрывает 1/12, а «нечетный» эту сумму выигрывает! Игра была нечестной. Кто-то подобрал матрицу выигрышей так, что едва заметное более частое (p=7/12) выбрасывание одного пальца тем, кто ставит на нечет, приводит его к небольшому постоянному выигрышу. Тот, кто попытается изменить стратегию, потеряет больше. «Я готов с вами сыграть при условии, что за мной право выбора ставки — чет или нечет» — предложил я. Попутчик играть отказался.

Huxleў:

Многие процессы в политике, экономике, биологии (этологии), в области человеческих отношений по сути носят игровой характер и могут анализироваться с использованием развитой в математике теории игр. Эта наука переживала взлеты и падения популярности, в основном связанные с тем, что люди по сути не рациональны и оптимизируют свое поведение скорее опираясь на эмоции, а не на трезвый расчет. В последние десятилетия основной тренд в развитии теории игр как раз связан с анализом оптимального поведения в приложениях к экономике, с учетом неполной информированности игроков, влияния случайных факторов и меняющихся внешних условий. 

Поделиться материалом

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Получайте свежие статьи

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: