
Научный анализ игр со случайным исходом возможен, он основан на выводах теории вероятностей. Этот анализ позволяет определить лишь шансы участников игры со случайным исходом при тех или иных условиях ее проведения. Однако общее знакомство с такими играми и с методами их анализа полезно при изучении стратегических игр, многие из которых содержат элементы, свойственные играм со случайным исходом.
В стратегических
компьютерных играх 1998 неопределенность исхода связана с тем, что каждый из игроков, принимая решение о выборе образа действий, не знает, какой стратегии будет придерживаться его противник. Простейшим примером стратегической игры является игра «Две монетки»: два ее участника одновременно кладут на стол по монете; если окажется, что монеты выложены одинаковыми* сторонами вверх, то выигрывает первый игрок; в противном случае — второй. В играх этого типа (в отличие от комбинаторных игр) каждый отдельный ход игрока нельзя назвать ни плохим, ни хорошим — это зависит от того, какой ход сделает его противник. В этом заключается основная особенность стратегических игр, делающая даже самые простые из них более трудными для анализа, чем сложные комбинаторные игры. Исследование многих стратегических игр осложняется еще и наличием случайных факторов (пример такой игры— домино).
На кружковых занятиях достаточно ограничиться лишь наиболее простыми парными конечными играми с нулевой суммой. В таких играх интересы игроков прямо противоположны: выигрыш одного из них равен проигрышу другого. Поэтому здесь можно рассматривать выигрыш только одного игрока, считая, что этот игрок стремится к достижению его максимума, тогда как другой игрок старается свести этот выигрыш к минимуму.
Элементарные представления о приемах анализа стратегических игр можно дать кружковцам, рассмотрев анализ какой-либо достаточно простой игры этого типа, например игры «Три пальца». В этой игре игроки А и В одновременно и независимо друг от друга показывают один, два или три пальца. Если сумма показанных ими чисел оказывается четной, то игрок А получает равное этой сумме число очков; если же она нечетная, то соответствующее число очков получает игрок В. Проанализируем эту игру.
У каждого из игроков по три стратегии: показать один, два или три пальца. Поэтому такую игру называют игрой 3X3. Все возможные результаты игры для различных стратегий, выбранных игроками А и В, и соответствующие выигрыши игрока А удобно представить в виде следующей таблицы (она называется «матрицей игры» или «платежной матрицей»):
Здесь на пересечении каждой пары стратегий игроков А и В записан выигрыш в очках, который получает игрок А (отрицательный выигрыш означает, что игрок В получает очки, а игрок А их теряет). Легко убедиться, что на любую из стратегий, выбранных игроком А, его противник может ответить наихудшим для А образом. Так, например, для А заманчиво воспользоваться стратегией A3, сулящей выигрыш 6 очков или, по крайней мере, 4 очка (в случае применения игроком В стратегий ВЗ и В1 соответственно). Но если при этом игрок В изберет стратегию В2, то игрок А проиграет 5 очков. Аналогично, выбирая стратегию А1 или A3, игрок А также не может быть уверен в выигрыше. В таком же затруднении находится и игрок В, который не знает, как сыграет А.
В осторожной игре, без излишней горячности и риска, каждый игрок стремится не столько к выигрышу, сколько к тому, чтобы уберечься от проигрыша. Поэтому ему следует выбирать свою стратегию так, чтобы даже наилучшая стратегия противника дала этому противнику наименьший выигрыш. Следовательно, для игрока А наиболее «безопасной» стратегией будет такая, у которой минимальный выигрыш является наибольшим по сравнению с минимальным выигрышем всех других его стратегий. Для стратегии А1 наименьшее значение выигрыша —3, для стратегии А2 оно равно —5, для стратегии A3 также — 5. Максимальным из этих минимальных значений является число —3, которому соответствует стратегия А1. Эта стратегия называется максиминной (от слов «максимум из минимумов»), а соответствующий ей выигрыш (в данном случае —3 очка) носит название нижней цены игры.
По аналогичным соображениям игрок В в расчете на умелое поведение игрока А должен отдать предпочтение той своей стратегии, у которой максимальный выигрыш противника будет наименьшим из максимальных выигрышей всех его стратегий. Для стратегии В1 наибольшее значение равно 4, для стратегии В2 оно также равно 4, а для стратегии ВЗ оно равно 6. Минимальный из этих максимумов равен 4 — это верхняя цена игры, ей соответствуют две минимаксные стратегии BI и В2.
Принцип осторожности, предписывающий игрокам выбор макси-минной и минимаксной стратегий, называют в теории игр принципом минимакса. Отступая от этого принципа в надежде на более крупный выигрыш, каждый из игроков идет на риск, связанный с возможностью более крупного проигрыша. Из сказанного не следует, однако, что при многократном повторении этой игры наиболее безопасно для каждого из игроков все время придерживаться одной и той же максиминной (минимаксной) стратегии. В самом деле, допустим, что игрок А до абсурда «сверхосторожен» и неуклонно придерживается во всех партиях игры стратегии AI. Тогда уже по результатам первых нескольких партий его противник догадается об этом и в дальнейшем будет неизменно отвечать выбором стратегии В2, обрекая игрока А на постоянный (хотя и не самый крупный) проигрыш.
Таким образом, в подобных играх большое значение имеет фактор «разведки» — получение каждым из игроков информации, на основании которой он мог бы прогнозировать стратегии, выбираемые противником. Чтобы затруднить противнику получение такой информации, нужно, очевидно, от партии к партии менять свои стратегии случайным образом, или, как говорят в теории игр, использовать смешанную стратегию. В теории игр доказывается, что в этой игре при многократном ее повторении наиболее целесообразной (оптимальной) смешанной стратегией для каждого из игроков является такая смешанная стратегия, при которой они показывают два пальца вдвое чаще, чем один или три.
Если каждый из игроков будет пользоваться своей оптимальной смешанной стратегией, то при большом количестве сыгранных партий средний выигрыш каждого будет равен нулю. Отклонение же от такой оптимальной стратегии грозит отклоняющемуся игроку проигрышем.
Следует обратить внимание на то, что в этой игре оба игрока, отклоняясь от своих максиминной и минимаксной стратегий, должны тщательно скрывать свои намерения друг от друга. Но есть и такие парные игры с нулевой суммой, в которых «осторожному» игроку незачем отклоняться от максиминной (минимаксной) стратегии и нет необходимости скрывать это от своего противника. Речь идет об играх, у которых верхняя и нижняя цены игры по своим значениям совпадают. В таких случаях это общее значение минимакса и максимина является наименьшим в своей строке матрицы и наибольшим в своем столбце, а об игре говорят, что ее матрица имеет седловую точку (это название объясняется тем, что подобная точка есть на поверхности седла: она занимает наивысшее положение при поперечном его разрезе и наинизшее — при продольном разрезе).
Седловая точка лежит на пересечении минимаксной и макси-минной стратегий. Эти стратегии являются оптимальными для обоих игроков. Если один из них решил придерживаться своей оптимальной стратегии, то для другого отклонение от своей подобной стратегии нецелесообразно, ибо в лучшем случае его выигрыш останется неизменным, а в худшем — уменьшится. При этом наличие у любого из. игроков информации о том, что его противник избрал свою оптимальную стратегию, не может изменить поведение этого игрока: если только последний не хочет действовать против своих же интересов, он и сам вынужден будет придерживаться своей оптимальной стратегии.
Игры, имеющие в матрице седловую точку, встречаются на практике довольно часто. В частности, в теории игр доказывается, что седловую точку имеет всякая игра с полной информацией.
Следует проанализировать с кружковцами в виде примеров несколько различных стратегических игр, составить для них платежные матрицы, определить значения минимакса и максимина и найти седловые точки, если они имеются, а при отсутствии седловой точки показать, как в простейших случаях определяются смешанные стратегии игроков.