admin / 13.05.2018

Игры с природой

Цель: научиться методам принятия решений в условиях неопределенности и риска (такие математические модели называются Играми с природой) на ЭВМ с использованием критериев Лапласа, Вальда, Байеса, Сэвиджа и Гурвица.

Рассмотрим ситуацию, когда лицо принимающее решение (ЛПР) может выбрать одну из n возможных альтернатив, которые обозначим A1, A2,…, An, то есть выбирает наилучший вариант действий из имеющихся п возможных. Выигрыш для каждой альтернативы зависит от того, какой вариант развития ситуации произойдет. Пусть возможны m вариантов развития ситуации, которые обозначим S1, S2,…, Sm.

Существует несколько критериев, позволяющих выбрать оптимальное решение в модели игры с природой. Сначала рассмотрим случай, когда показатель привлекательности (выигрыш ЛПР) максимизируется – «чем больше, чем лучше». Рассмотрим на примере способы решения такой задачи.

ПРИМЕР 6.1.Директор финансовой компании проводит рискованную финансовую операцию. Страховая компания предлагает застраховать сделку и предлагает 4 варианта страховки: A1, A2, A3, A4. Компенсация ущерба для каждого варианта зависит от того, какой из возможных страховых случаев произошел. Выделяют 5 видов страховых случаев: S1, S2, S3, S4, S5.Компенсации (тыс. у.е.) для каждого вида страховки при каждом страховом случае составляют матрицу выигрышей вида:

Ai/Sj S1 S2 S3 S4 S5
A1
A2
A3
A4

Выбрать наилучшую альтернативу, используя критерии Лапласа, Вальда, Байеса (при вероятностях состояний исходов p1 = 0,3; p2 = 0,2; p3= 0,1; p4= 0,3; p5 = 0,1), Сэвиджа и Гурвица (при коэффициенте доверия α=0,4).

Вводим данные в электронную таблицу и готовим подписи в ячейках для дальнейшего расчета согласно рис. 6.1:

Рисунок 6.1 Решение примера 6.1

Вычисляем функции полезности для критерия Лапласа. Для этого ставим курсор в ячейку G2 и вводим формулу, усредняющую значения показателей привлекательности по первой альтернативе. Для этого вызываем мастер функций, нажимая на кнопку fx и выбираем в категории «Статистические» функцию «СРЗНАЧ», в качестве аргумента функции указываем ячейки B2:F2, обводя их курсором. Нажимаем ОК, видим результат 40,2. Автозаполняем ячейки G2-G5, перетаскивая нижний правый уголок ячейки G2. Видно, что наибольшая функция полезности 40,4 для альтернативы А3. Вводим в G6: «А3».

Для критерия Вальда вычисляем наименьшие показатели привлекательности для каждой альтернативы. Для этого вводим в Н2 функцию МИН с аргументами B2:F2: «=МИН(B2:F2)» (кавычки не вводить!). Автозаполняем на Н2-Н5. Выбираем альтернативу, где результат наибольший. Это значение 37 для альтернативы А2, вводим в Н6: «А2».

Для критерия Байеса функции полезности равны суммам выигрышей, умноженным на вероятности их исходов. Вводим в I2 формулу:

«=В2*0,3+C2*0,2+D2*0,1+E2*0,3+F2*0,1», автозаполняем на I2-I5. Выбираем альтернативу с наибольшей функцией полезности, то есть А4, вводим в I6: «А4».

Для критерия Сэвиджа необходимо построить матрицу рисков.

Для этого ставим курсор в ячейку В8 и вводим формулу «=МАКС(B$2:B$5)-B2», автозаполняем результат на ячейки В8-F11.

Далее находим максимальный риск для каждой альтернативы. Для этого ставим курсор в ячейку J2 и вводим «=МАКС(B8:F8)», автозаполняем результат на J2-J5. Выбираем альтернативу с минимальным риском, это А3. Вводим в J6: «А3».

Для критерия Гурвица нужно наибольшее значение каждой альтернативы умножить на α(по условию α= 0,4 ), наименьшее на (1- α) и результаты сложить. Вводим в К2 формулу:

=МАКС(B2:F2)*0,4+МИН(B2:F2)*0,6 и автозаполняем результат на К2-К5. Выбираем альтернативу с наибольшей функцией полезности. Это А3, вводим К6: «А3». Задача решена.

Рассмотрим теперь метод решения задачи в случае минимизации критерия – «чем меньше, тем лучше».

ПРИМЕР 6.2. Фермер, имея в аренде большие площади под посев кукурузы, заметил, что влажности почвы в сезон созревания кукурузы недостаточно, чтобы получить максимальный урожай. Эксперты советовали фермеру провести дренажные каналы в период конца весны – начала лета, что должно значительно повысить урожай. Были предложены 5 проектов дренажных каналов: A1, A2, A3, A4, A5, затраты на которые зависят от погодных условий в период весна – лето.

Возможны варианты: S1 – дождливая весна и дождливое лето; S2 – дождливая весна и сухое лето; S3 – сухая весна и дождливое лето; S4 – сухая весна и сухое лето. Матрица затрат имеет вид:

Ai/Sj S1 S2 S3 S4
A1
A2
A3
A4
A5

Выбрать наилучшую альтернативу, используя критерии Лапласа, Вальда, Байеса с p1 = 0,2; p2 = 0,3; p3 = 0,3; p4 = 0,2 , Сэвиджа и Гурвица при коэффициенте доверия α = 0,7 .

Вводим данные в электронную таблицу и готовим подписи в ячейках для дальнейшего расчета согласно рис. 6.2:

Рисунок 6.2 Решение примера 6.2

Вычисляем функции полезности для критерия Лапласа. Для этого ставим курсор в ячейку F2 и вводим формулу:

«=СРЗНАЧ(В2:Е2)», автозаполняем на F2-F6. Наилучшей в данном случае считается альтернатива с минимальной функцией полезности, это А2. Вводим в F7: «А2».

Для критерия Вальда вычисляем наибольшие показатели привлекательности для каждой альтернативы. Для этого вводим в G2 функцию «=МАКС(B2:E2)», автозаполняем на G2-G6. Выбираем альтернативу, где результат наименьший, вводим в G7: «А2».

Для критерия Байеса функция полезности вычисляется так же как и для предыдущего примера (но для 4-х состояний природы), в ячейку Н2 формулу «=B2*0,2+C2*0,3+D2*0,3+E2*0,2», автозаполняем на Н2-Н6. Выбираем альтернативу с наименьшей функцией полезности, это А1, вводим в Н7: «А1».

Для критерия Сэвиджа необходимо построить матрицу рисков. Для этого ставим курсор в ячейку В9 и вводим формулу «=B2-МИН(B$2:B$6)», автозаполняем результат на ячейки В9-Е13.

Далее находим максимальный риск для каждой альтернативы. Для этого ставим курсор в ячейку I2 и вводим «=МАКС(B9:E9)», автозаполняем результат на I2-I6. Выбираем альтернативу с минимальным риском, таких альтернатив две, это А1 и А4. Вводим в I7: «А1, А4».

Для критерия Гурвица нужно наименьшее значение каждой альтернативы умножить на α(по условию α= 0,7), наибольшее на (1– α) и результаты сложить. Вводим в J2 формулу:

= МИН(B2:E2)*0,7+МАКС(B2:E2)*0,3

и автозаполняем результат на J2-J6. Выбираем альтернативу с наименьшей функцией полезности. Это А1, вводим J7: «А1». Задача решена.

Задание 6.1. Директор торговой фирмы, продающей телевизоры, решил открыть представительство в областном центре. У него имеются альтернативы либо создавать собственный магазин в отдельном помещении, либо организовывать сотрудничество с местными торговыми центрами. Всего можно выделить 5 альтернатив решения: A1, A2, A3, A4, A5. Успех торговой фирмы зависит от того, как сложится ситуация на рынке предоставляемых услуг. Эксперты выделяют 4 возможных варианта развития ситуации S1, S2, S3, S4.

Прибыль фирмы для каждой альтернативы при каждой ситуации представлена матрицей выигрышей aij (млн. р./год).

Аi/Bj S1 S2 S3 S4
A1 a
A2
A3 a
A4
A5

Выбрать наилучшую альтернативу, используя критерии Лапласа, Вальда, Байеса с p1 = 0,4; p2 = 0,3; p3 = 0,1; p4 = 0,2 , Сэвиджа и Гурвица при коэффициенте доверия α = 0,6.

Значение неизвестного параметра а взять равным номеру варианта.

Задание 6.2. Нефтяная компания собирается построить в районе крайнего севера нефтяную вышку. Имеется 4 проекта A, B, C и D.

Затраты на строительство (млн. руб.) зависят от того, какие погодные условия будут в период строительства. Возможны 5 вариантов погоды S1, S2, S3, S4, S5. Выбрать оптимальный проект для строительства используя критерии Лапласа, Вальда, Байеса с p1 = 0,1; p2= 0,2; p3= 0,3; p4= 0,2; p5 = 0,2, Сэвиджа и Гурвица при α = 0,6. Матрица затрат имеет вид:

Аi/Sj S1 S2 S3 S4 S5
A1 а
A2
A3 a
A4

Значение неизвестного параметра а взять равным номеру варианта.


⇐ Предыдущая11121314151617181920Следующая ⇒


Дата публикования: 2015-01-10; Прочитано: 237 | Нарушение авторского права страницы



studopedia.org — Студопедия.Орг — 2014-2018 год.(0.003 с)…
Поиск Лекций


Принятие решений по критериям Лапласа, Вальда, Гурвица, Сэвиджа, Байеса теории статистических игр

В теории статистических игр условия выполнения операции зависят от

объективной действительности, которую в теории игр принято называть «природой». Соответствующие ситуации называют «играми с

 

природой» (статистическими играми). «Природа» в теории игр

рассматривается как некая незаинтересованная инстанция, поведение которой хотя и неизвестно, но, во всяком случае, не содержит элемента сознательного противодействия нашим планам.

Пусть сторона А имеет возможных стратегий [6]

О состоянии «природы» можно сделать предположений

Для каждой пары стратегий () существует функция которая является случайной величиной и называется функцией потерь.

Пусть удаётся определить величину − эффективность решения в условиях для всех комбинаций пар стратегий . В этом случае платёжная матрица игры имеет вид:

В теории статистических игр, помимо платёжной матрицы, используется и, так называемая, матрица рисков или матрица сожалений.

Риском стороны А при использовании стратегии в условиях называется величина

(2.14)

 

где − максимальный выигрыш стороны А в состоянии «природы» ПJ .

26

Критерий Лапласа основан на предположении, что каждый вариант развития ситуации (состояния «природы») равновероятен. Для каждой строки матрицы выигрышей подсчитывается среднее арифметическое значение оценок.

Теория игр Игры с природой

Оптимальному решению будет соответствовать такое решение, которому соответствует максимальное значение среднего арифметического, т.е.

n

F*= F(X*,Y)= max (1/n) ∑ aij (2.15)

j=1

Критерий Вальда. основывается на принципе максимального пессимизма, то есть на предположении, что произойдет наиболее худший вариант развития ситуации и риск наихудшего варианта нужно свести к минимуму.

В каждой строчке матрицы выбираем минимальную оценку. Оптимальному решению соответствует такое решение, которому соответствует максимум этого минимума, т. е.

F*= F(X*,Y)= max min aij , (2.16)

1≤im1≤jm

Этот критерий очень осторожен. Он ориентирован на наихудшие условия, только среди которых и отыскивается наилучший и теперь уже гарантированный результат. Критерий Вальда основывается на предположении, что произойдет наиболее худший вариант развития ситуации и риск наихудшего варианта нужно свести к минимуму.

Критерий Сэвиджа. Сущность этого критерия заключается в минимизации

риска. Как и критерий Вальда, критерий Сэвиджа очень осторожен. Они

 

различаются разным пониманием худшей ситуации: в первом случае — это минимальный выигрыш, во втором — максимальная потеря выигрыша по

сравнению с тем, чего можно было бы достичь в данных условиях. В каждом столбце матрицы находится максимальная оценка max аij и составляется новая матрица, элементы которой определяются соотношением (2.14) для rij . Под риском rij понимают разность между максимальным выигрышем, который имел бы место, если бы было достоверно известно, что наступит ситуация yj, , и выигрышем при выборе решения хi в условиях yj. . Далее из матрицы рисков выбирают такое решение, при котором величина риска принимает наименьшее значение в самой неблагоприятной ситуации, т.е.

F*= F(X*,Y)= max min ( maxaj -aij ), (2.17)

1≤im1≤jn 1≤im

Сущность этого критерия заключается в минимизации риска. Как и критерий Вальда, критерий Сэвиджа очень осторожен. Они различаются разным пониманием худшей ситуации: в первом случае — это минимальный выигрыш, во втором — максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях.

Критерий Гурвица —критерий «оптимизма — пессимизма» ЛПР. Вводится коэффициент оптимизма, с которой произойдет наилучший для ЛПР исход, наихудший вариант можно ожидать с вероятностью (1-α), 0< α <1.

В каждой строке матрицы выигрышей находится самая большая оценка max аij и самая маленькая min aij.

Они умножаются соответственно на α и (1 — α ) и затем вычисляется их сумма. Оптимальному решению будет соответствовать такое решение, которому соответствует максимум этой суммы, т.е.

 

28

F*= F(X*,Y)= max [αmax aij + ( 1- α)min aij ], (2.18)

1≤im 1≤jn 1≤jn

При α = 0 критерий Гурвица трансформируется в критерий Вальда. Это случай крайнего «пессимизма». При α = 1 (случай крайнего «оптимизма») человек, принимающий решение, рассчитывает на то, что ему будет сопутствовать самая благоприятная ситуации. «Коэффициент оптимизма» а назначается субъективно, исходя из опыта, интуиции и т.п. Чем более опасна ситуация, тем более осторожным должен быть подход к выбору решения и тем меньшее значение присваивается коэффициенту α

Критерий Байеса. За оптимальную стратегию принимается чистая стратегия при которой величина достигает наибольшего значения. С помощью этого критерия задача принятия решения в условиях неопределённости сводится к задаче принятия решения в условиях определённости, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем. По критерию Байеса, оптимальной будет та стратегия при которой минимизируется величина среднего риска

(2.19)

Стратегия, максимизирующая средний выигрыш, совпадает со стратегией, минимизирующей средний риск.

Стратегия, максимизирующая средний выигрыш, совпадает со стратегией минимизации риска.

Пример выбора стратегии по критериям Лапласа, Вальда, Гурвица, Сэвиджа, Байеса .При планировании операции в заранее неясных условиях, относительно которых можно сделать различные предположения

Задана платёжная матрица

1. Критерий Вальда. В каждой строке платёжной матрицы выбираем наименьший выигрыш и из полученных значений берём наибольшее:

Следовательно оптимальной является стратегия

2. Критерий Сэвиджа. Построим сначала матрицу сожалений Для этого вычислим максимальные выигрыши стороны при трёх различных состояниях «природы»:

Теперь можем вычислить элементы матрицы сожалений:

Матрица сожалений имеет вид:

В каждой строке матрицы сожалений выберем наибольший риск и из полученных значений отметим наименьшее:

Следовательно, согласно критерию Сэвиджа, оптимальными являются стратегии и

3.

Критерий Гурвица. В каждой строке платёжной матрицы определяем лри коэффициенте оптимизма α=0,6 наименьший и наибольший выигрыши и соответственно, а затем для каждой строки вычисляем величину :

По критерию Гурвица при α=0,6 оптимальной является стратегия

 

©2015-2018 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Нарушение авторских прав и Нарушение персональных данных

Пример.

Игры с природой в условиях неопределённости и понятная литература.

Дана таблица выигрышей в игре с природой

П1

П2

П3

П4

А1

13

-5

3

8

А2

0

8

14

2

А3

5

4

5

7

Определим оптимальную стратегию первого игрока по различным критериям:

1) по критерию максимального среднего выигрыша, если экспертные оценки вероятностей составляют р1, р2, р3, р4,

Где р1=0,1, р2=0,3, р3 =0,4, р4=0,2.

Следовательно, оптимальной является стратегия А2.

2) по критерию Сэвиджа.

Найдем матрицу риска. Матрица риска строится следующим образом. По каждому столбцу находится элемент с максимальным значением . Каждый элемент матрицы риска в j-том столбце находится как разность rij = bj – aij. Следовательно, матрицу риска R записываем следующим образом:

.

Оптимальной является третья стратегия А3.

3) По критерию Гурвица с показателем пессимизма .

G1 = (1/4) ´ (-5) + (1 – (1/4)) ´ 13 = 34/4,

G2 = (1/4) ´ 0 + (1 – (1/4)) ´ 14=42/4,

G3 = (1/4) ´ 4 + (1 – (1/4)) ´ 7=25/4,

G=max (34/4, 42/4, 25/4) = 42/4.

Оптимальная стратегия — А2.

4) По критерию Вальда:

.

Оптимальная стратегия — А3.

Тема Игры с “природой”

Math
Высшая Математика Решение задач и примеров — OnLine
./ Главная /Теория игр, ШАГ-1 >

Теория Игр. Решение задач матричных игр — OnLine
Принятие решений в условиях противодействия (конфликта)

Решение матричной игры будет найдено непосредственно на сайте, с выводом всех промежуточных результатов и комментариями, вам необходимо только заполнить предлагаемые формы и нажать кнопку [Дальше—>]. Процесс вычисления будет представлен максимально подробно, с геометрической интерпретацией (графический метод решения) при необходимости. Будет определена верхняя и нижняя цена игры и найдены оптимальные стратегии для обоих игроков. Если вы используете наш сервис в первый раз, рекомендуем ознакомиться с правилами записи чисел в поля формы.

Смотри также : подробности о сервисе.

Для решения игры укажите число стратегий для каждого игрока и способ представления чисел.

к списку решаемых задач…

FILED UNDER : IT

Submit a Comment

Must be required * marked fields.

:*
:*