Бесконечные антагонистические игры
Категория реферата: Рефераты по математике
Теги реферата: курсовая работа по менеджменту, деловое общение реферат
Добавил(а) на сайт: Boris.
Предыдущая страница реферата | 1 2 3 4 5 6 7 | Следующая страница реферата
Степень близости к цене игры может характеризоваться числом e > 0. Поэтому в описываемой игре можно говорить об оптимальности чистых стратегий хo = 1, yo = 0 соответственно игроков 1 и 2 с точностью до произвольного числа e > 0. В связи с этим введём следующие определения.
Точка (,), где ÎX, ÎY, в антагонистической непрерывной игре G называется точкой e-равновесия , если для любых стратегий xÎX игрока 1, yÎY игрока 2 имеет место неравенство
М(х,) - e £ M(,) £ М(, y) + e.
Точка e-равновесия (,) называется также e-седловой точкой функции М(x, y), а стратегии и называются e-оптимальными стратегиями. Эти стратегии являются оптимальными с точностью до e в том смысле, что, если отклонение от оптимальной стратегии никакой пользы игроку принести не может, то его отклонение от e-оптимальной стратегии может увеличить его выигрыш не более, чем на e.
Можно доказать, что для того, чтобы функция М имела e-седловые точки для любого e>0 необходимо и достаточно чтобы
M(x, y) = M(x, y).
Если игра G не имеет седловой точки (e-седловой точки) в чистых стратегиях, то оптимальные стратегии можно искать среди смешанных стратегий. Однако, в качестве вероятностной меры здесь вводятся функции распределения вероятностей применения игроками чистых стратегий.
Пусть F(х) – функция распределения вероятностей применения чистых стратегий игроком 1. Если число x - чистая стратегия игрока 1, то
F(х) = P(x £ х),
где P(x £ х) означает вероятность того, что случайно выбранная чистая стратегия x не будет превосходить числа х. Аналогично рассматривается функция распределения вероятностей применения чистых стратегий h игроком 2
Q(y) = P(h £ y).
Функции F(х) и Q(y) называются смешанными стратегиями соответственно игроков 1 и 2. Если F(х) и Q(y) дифференцируемы, то существуют их производные, обозначаемые соответственно через f(x) и q(y) (функции плотности распределения).
В общем случае дифференциал функции распределения dF(х) выражает вероятность того, что стратегия x находится в промежутке
х £ x £ х + dх.
Аналогично для игрока 2: dQ(y) означает вероятность того, что его стратегия h находится в интервале
y £ h £ y + dy.
Тогда выигрыш игрока 1 составит
М(х, y) dF(х),
а выигрыш игрока 2 равен
М(х, y) dQ(y).
Средний выигрыш игрока 1 при условии, что игрок 2 применяет свою чистую стратегию y, получим, если проинтегрируем выигрыш по всем возможным значениям х, т.е.
E(F, y) =
Напомним, что множество Y для y является замкнутым промежутком [0; 1].
Если игрок 1 применяет свою чистую стратегию х, а игрок 2 - y, то выигрыш игрока 1 составит
М(х, y) dP(х) dQ(y).
Рекомендуем скачать другие рефераты по теме: сочинение рассуждение, шпаргалки по математике.
Предыдущая страница реферата | 1 2 3 4 5 6 7 | Следующая страница реферата