Статистичні ігри та прийняття рішень в умовах невизначеності. Прийняття рішень за умов невизначеності Максимальний критерій Вальда

Головна > Документ

1.4.Крітерій песимізму-оптимізму Гурвіца.

Звісно ж логічним, що з виборі рішення замість двох крайнощів у оцінці ситуації дотримуватися певної проміжної позиції, враховує можливість як найгіршого, і найкращого, сприятливого поведінки природи. Такий компромісний варіант був запропонований Гурвіцем. Відповідно до цього підходу для кожного рішення необхідно визначити лінійну комбінацію min і max виграшу і взяти ту стратегію, на яку ця величина виявиться найбільшою, тобто. намагаючись зайняти врівноважену позицію, Гурвіц запропонував критерій (HW), оцінна функція якого знаходиться десь між точками граничного оптимізму та крайнього песимізму. Оціночна функція має дві форми запису: Z H W ​​=, (5) де  - "ступінь песимізму" ("коефіцієнт песимізму", ваговий множник), 0  1. Правило вибору згідно з критерієм Гурвіца (HW – критерію) формулюється так: Матриця рішень доповнюється стовпцем, що містить середні зважені найменшого та найбільшого результатів кожного рядка. Вибираються ті варіантиXi, у рядках яких стоять найбільші елементиa ir цього стовпця.При =1 критерій Гурвіца (5) тотожний критерію Вальда, а при  =0 – критерій крайнього оптимізму (критерій азартного гравця), який рекомендує вибрати ту стратегію, за якої найбільший виграш у рядку максимальний. У технічних програмах правильно вибрати цей множник буває так само важко, як і вибрати критерій. Навряд чи можна визначити кількісну характеристику для тих часток оптимізму і песимізму, які присутні при прийнятті рішення. Тому найчастіше ваговий множник =0.5 без заперечень приймається як деяка "середня" точка зору. На вибір значення ступеня песимізму впливає міра відповідальності: чим серйознішими є наслідки помилкових рішень, тим більше бажання приймаючого рішення застрахуватися, тобто ступінь песимізму  ближче до одиниці. Розглянемо застосування критерію Гурвіца для даних таблиці 1 та ступеня песимізму =0.6. Для стратегії X 1 мінімальне значення рівне 1, а максимальне – 10. Використовуючи формулу (6), обчислимо а 1 r =0.6*1+0.4*10=4.6. Аналогічно для другої стратегії. Знаходимо максимальне значення стовпця а ir. В результаті отримаємо таблицю 11. Таблиця 11

Отже, за критерієм Гурвіца за =0.6 слід вибирати стратегію X 1 . Зауваження. У літературі використовується така форма критерію Гурвіца: Z H W ​​=
, (6) де  - "ступінь оптимізму" ("коефіцієнт оптимізму ", ваговий множник), 01. При =0 критерій Гурвіца (6) тотожний критерію Вальда, а при =1 збігається з максимінним рішенням. Критерій Гурвіца висуває до ситуації, в якій приймається рішення, такі вимоги:
    про ймовірність появи Вj нічого не відомо; з появою станів Вj необхідно рахуватися; реалізується лише мала кількість рішень; допускається певний ризик.

1.5.Крітерій Севіджа (критерій мінімаксу ризику).

Насправді, вибираючи одне з можливих рішень, часто зупиняються на тому, здійснення якого призведе до найменш тяжких наслідків, якщо вибір виявиться помилковим. . Цей підхід до вибору рішення математично був сформульований американським статистиком Севіджем (Savage) у 1954 році та отримав назву принципу Севіджа. Він особливо зручний для економічних завдань і часто застосовується для вибору рішень в іграх з природою. За принципом Севіджа кожне рішення характеризується величиною додаткових втрат, що виникають при реалізації цього рішення, в порівнянні з реалізацією рішення, правильного при цьому стані природи. Звичайно, правильне рішення не тягне за собою ніяких додаткових втрат, і їхня величина дорівнює нулю. При виборі рішення, що найкраще відповідає різним станам природи, слід брати до уваги лише ці додаткові втрати, які, по суті, будуть наслідком помилок вибору. Для вирішення завдання будується так звана "матриця ризиків", елементи якої показують, який збиток зазнає гравець (ЛПР) у результаті вибору неоптимального варіанта вирішення. Ризикомгравця r ij при виборі стратегії iв умовах (станах) природи jназивається різниця між максимальним виграшем, який можна отримати у цих умовах та виграшем, який отримає гравець у тих же умовах, застосовуючи стратегію i. Якби гравець знав заздалегідь майбутній стан природи j, він вибрав би стратегію, якій відповідає максимальний елемент у цьому стовпці:
, І тоді ризик:
. Критерій Севіджа рекомендує в умовах невизначеності вибирати рішення, що забезпечує мінімальне значення максимального ризику: Z S =
.
(6) Розглянемо застосування критерію Севіджа для даних таблиці 10. Будуємо матрицю "ризиків" для цього знаходимо максимальні значення для кожного стовпця таблиці 1. Вони дорівнюють 1.1; 10 і 1.2 відповідно і знаходимо значення ризиків за формулою. Доповнюємо цю матрицю стовпцем найбільших різниць. Вибираємо ті варіанти, у рядках яких стоїть найменше для цього стовпця значення. В результаті отримаємо таблицю 12. Таблиця 12. Матриця ризиків
Критерій Севіджа рекомендує вибрати стратегію X1.

1.6.Крітерій Лапласа.

У ряді випадків є правдоподібним наступне міркування: оскільки невідомі майбутні стани природи, остільки можна вважати їх рівноймовірними. Цей підхід до рішення використовується за критерієм “ недостатньої основи” Лапласа. Для вирішення задачі для кожного рішення підраховується математичне очікування виграшу (імовірності станів природи вважаються рівними q j = 1/n, j = 1:n), і вибирається те рішення, при якому величина цього виграшу максимальна. Z L =
. Гіпотеза про рівноймовірність станів природи є досить штучною, тому принцип Лапласа можна користуватися лише в обмежених випадках. У загальному випадку слід вважати, що стан природи не рівноймовірні і використовуватиме вирішення умов Байеса-Лапласа.

1.7.Крітерій Байєса-Лапласа.

Цей критерій відступає від умов повної невизначеності - він передбачає, що можливим станам природи можна приписати певну ймовірність їх настання і, визначивши математичне очікування виграшу для кожного рішення, вибрати те, що забезпечує найбільше значення виграшу: Z BL =
. Цей метод передбачає можливість використання будь-якої попередньої інформації про стан природи. У цьому передбачається як повторюваність станів природи, і повторюваність рішень, і, насамперед, наявність досить достовірних даних про минулих станах природи. Тобто, ґрунтуючись на попередніх спостереженнях, прогнозувати майбутній стан природи. статистичний принцип). Повертаючись до таблиці 1 припустимо, що q 1 =0.4, q 2 =0.2 і q 3 =0.4. Тоді, згідно з критерієм Байєса-Лапласа, таблицю 1 доповнюємо стовпцем математичних очікувань і серед цих значень вибираємо максимальне. Отримаємо таблицю 13. Таблиця 13.
Оптимальним є рішення X1. Критерій Байєса-Лапласа пред'являє до ситуації, в якій приймається рішення, такі вимоги:
    ймовірності появи станів Вj відомі та не залежать від часу; рішення реалізується (теоретично) нескінченно багато разів; для небагатьох реалізацій рішення допускається певний ризик.
При досить велику кількість реалізацій середнє значення поступово стабілізується. Тому за повної (нескінченної) реалізації будь-якої ризик виключено. Вихідна позиція застосовуючого – критерій оптимістичніший, ніж у випадку критерію Вальда, однак вона передбачає більш високий рівень поінформованості та досить довгі реалізації. достатньо, щоб проблема вибору рішення стала неоднозначною: Таблиця 14. Оптимальні варіанти, отримані за допомогою різних критеріїв
Рішення

Критерії

Стратегії Вальда maxmax Гурвиця,=0.6 Севіджа Лапласа Байєса-Лапласаq 1 =0.4, q 2 =0.2, q 3 =0.4
З таблиці 14 видно, що з обраного критерію (а, зрештою - від припущень) залежить вибір оптимального рішення. Вибір критерію (як і вибір принципу оптимальності) є найважчим і найвідповідальнішим завданням у теорії прийняття рішень. Однак конкретна ситуація ніколи не буває настільки невизначеною, щоб не можна було отримати хоча б часткову інформацію щодо ймовірнісного розподілу станів природи. У цьому випадку, оцінивши розподіл ймовірностей станів природи, застосовують метод Байєса-Лапласа або проводять експеримент, що дозволяє уточнити поведінку природи. Оскільки різні критерії пов'язані з різними умовами, в яких приймається рішення, найкраще для порівняльної оцінки рекомендації тих чи інших критеріїв отримати додаткову інформацію про ситуацію. Зокрема, якщо рішення, що приймається, відноситься до сотень машин з однаковими параметрами, то рекомендується застосовувати критерій Байєса-Лапласа. Якщо ж кількість машин невелика, краще скористатися критеріями мінімакса або Севіджа. Приклади постановки розв'язання задачУ цьому параграфі на прикладі розв'язання задач ми повинні навчитися визначати вектор стратегій, вектор станів та платіжну матрицю та застосовувати різні критерії для отримання оптимального рішення. Завдання. У приморському місті вирішено відкрити яхт-клуб. Скільки варто закупити яхт(З розрахунку: одна яхта на 5 осіб), якщо передбачуване число членів клубу коливається від 10 до 25 осіб. Річний абонемент коштує 100 грошових одиниць. Ціна яхти – 170 грошових одиниць. Оренда приміщення та зберігання яхт обходиться у 730 грошових одиниць на рік. Рішення.Безсумнівно, що має сенс розглядати кількість яхт, що купуються в діапазоні від двох до п'яти (4 варіанти) і кількість потенційних яхтсменів від 10 до 25. Для зменшення обсягу перебору обмежимося варіантами 10, 15, 20, 25 (якщо отримані висновки для суміжних варіантів будуть істотно відрізнятись, проведемо додатковий, уточнюючий розрахунок). Отже: X= { X i } = (2, 3, 4, 5) – кількість яхт (i=1,2,3,4); B = { B j } =(10, 15, 20, 25) – кількість членів яхт-клубу (j=1,2,3,4). Для того, щоб розпочати пошук рішення, збудуємо матрицю рішень, елементи якої показують прибуток при прийнятті i-го рішення при jкількості членів яхт-клубу:

a ij = 100 ´ min(5´ X i ; B j ) - 170 ´ X i - 730

Тобто. Виконавши нескладні розрахунки, заповнимо матрицю рішень (a ij) (див. табл. 15): Таблиця 15. Платіжна матриця

Наприклад, a 11 = 100´min(52, 10) - 170´2-730 =-70 a 12 =100´min(5´2, 15)-170´2-730=-70 a 13 = a 14 = -70 (попит на яхти залишиться незадоволеним). Негативні значення показують, що за цих співвідношеннях попиту яхти та його наявності яхт-клуб зазнає збитків. Критерій Вальда(Вибір обережної, песимістичної стратегії) – для кожної альтернативи (кількість яхт у клубі) вибирається найгірша ситуація (найменше значення величини прибутку) і серед них знаходиться гарантований максимальний ефект:

Z MM =max(-70 ; -240; -410; -580)= -70

Висновок : приймаючи рішення за критерієм Вальда, яхт-клуб слід закупити 2 яхти і максимум очікуваного збитку не перевищить 70 д.е. Критерій Гурвіца(компромісне рішення між найгіршим результатом та надмірно оптимістичним). Розглянемо зміну розв'язання нашого завдання залежно від значень коефіцієнта оптимізму (у таблиці 16 виділено значення, що задовольняють критерію Гурвіца за різних ): Таблиця 16. Рішення щодо Гурвіца для різних
Висновок : при  0,5 слід закупити 5 яхт і чекати на прибуток порядку, не менший 170 д.е. (сподіваємося на широку популярність нашого клубу та певну фінансову спроможність любителів), при = 0,2 не слід закуповувати більше 2 яхт (ми більш обережні у своїх прогнозах і, швидше за все, віддамо перевагу відмовитися від створення клубу). Критерій Севіджа(знаходження мінімального ризику). При виборі рішення за цим критерієм спочатку матриці корисності зіставляється матриця жалю D Робоча програма

Теорія прийняття рішень – прикладна дисципліна та галузь досліджень, що залучає поняття та методи математики, статистики, економіки, менеджменту та психології, яка у форматі економічних додатків вивчає методи та закономірності

Найбільш просто вирішується завдання про вибір рішення в умовах невизначеності, коли нам хоч і невідомі умови виконання операції (стан природи), але відомі їх ймовірності:

У цьому випадку як показник ефективності, який ми прагнемо звернути в максимум, звичайно взяти середнє значення, або математичне очікування виграшу, з урахуванням ймовірностей всіх можливих умов.

Позначимо це середнє значення для стратегії гравця через

або, коротше,

Очевидно, є не що інше, як виважене середнє виграшів рядка, взятих з кесами. Як оптимальна стратегія природно вибрати ту зі стратегій для якої величина звертається в максимум.

За допомогою такого прийому завдання про вибір рішення в умовах невизначеності перетворюється на задачу про вибір рішення в умовах визначеності, тільки прийняте рішення є оптимальним не в кожному окремому випадку, а в середньому.

Приклад 1. Планується операція заздалегідь невідомих метеорологічних умовах; варіанти цих умов: Відповідно до матеріалів метеозведення за багато років частоти (ймовірності) цих варіантів рівні відповідно:

Можливі варіанти організації операції у різних метеоумовах приносять різну вигоду. Значення «доходу» для кожного рішення в різних умовах наведено у табл. 13.1

Таблиця 13.1

В останньому рядку наведені ймовірності умов. Середні виграші наведені в останній колонці. З нього видно, що оптимальною стратегією гравця є його стратегія, що дає середній виграш (відзначений зірочкою).

При виборі оптимальної стратегії у невідомих умовах із відомими ймовірностями можна користуватися не лише середнім виграшем

але й середнім ризиком

який, зрозуміло, треба звернути не максимум, а мінімум.

Покажемо, що стратегія, що максимізує середній виграш, збігається зі стратегією, що мінімізує середній ризик. Обчислимо обидва ці показники і складемо їх:

(13.2)

Ця сума (середнє зважене значення максимумів стовпців) для даної матриці є постійна величина; Позначимо її З:

звідки середній ризик дорівнює

Очевидно, ця величина звертається в мінімум тоді, коли а, - максимум, отже, стратегія, обрана з умов мінімального середнього ризику, збігається зі стратегією, обраної з умов максимального середнього виграшу.

Зауважимо, що у випадку, коли відомі ймовірності станів природи при вирішенні гри з природою, завжди можна обійтися одними чистими стратегіями, не застосовуючи змішаних. Справді, якщо ми застосовуватимемо якусь змішану стратегію

тобто стратегію з ймовірністю стратегію з ймовірністю і т. д., то наш середній виграш, опосередкований і за умовами (станами природи) і за нашими стратегіями, буде:

Це – виважене середнє виграшів, що відповідають нашим чистим стратегіям.

Але зрозуміло, будь-яке середнє неспроможна перевищувати максимальної з осредняемых величин:

Тому застосування змішаної стратегії з будь-якими ймовірностями не може бути вигіднішим для гравця, ніж застосування чистої стратегії.

Ймовірності умов (станів природи) можна визначити зі статистичних даних, що з багаторазовим виконанням подібних операцій чи просто з проведенням спостережень над станами природи. Наприклад, якщо залізниці за цей проміжок часу виконати не цілком відомий обсяг перевезень, то дані про розподіл умов можуть бути взяті з досвіду минулих років. Якщо, як у попередньому прикладі, успіх операції залежить від метеоумов, дані можуть бути взяті зі статистики метеосводок.

Однак часто трапляються випадки, коли, приступаючи до виконання операції, ми не маємо уявлення про ймовірність станів природи; всі наші відомості зводяться до переліку варіантів станів, а оцінити їх ймовірність ми можемо. Так, наприклад, навряд чи нам вдасться розумно оцінити ймовірність того, що протягом найближчих років буде запропоновано і реалізовано важливий технічний винахід.

Зрозуміло, в подібних випадкахймовірності умов (станів природи) можна оцінити суб'єктивно: деякі з них видаються нам більше, інші - менш правдоподібними. Для того, щоб наші суб'єктивні уявлення про більшу чи меншу «правдоподібність» тієї чи іншої гіпотези перетворити на чисельні оцінки, можуть застосовуватись різні технічні прийоми. Так, якщо ми не можемо віддати перевагу жодній гіпотезі, якщо всі вони для нас рівноправні, то природно призначити їх ймовірності рівними один одному:

Це так званий «принцип недостатньої основи» Лапласа. Інший випадок, що часто зустрічається - коли ми маємо уявлення про те, які умови більш ймовірні, а які - менш, тобто можемо розмістити наявні гіпотези в порядку спаду їх правдоподібності: всього правдоподібніше перша гіпотеза (ПЗ, потім друга ) найменш правдоподібна гіпотеза (). Проте, наскільки одна з них найімовірніша за іншу - ми не знаємо. У цьому випадку можна, наприклад, призначити ймовірність гіпотез пропорційними членам спадної арифметичної прогресії:

або, враховуючи, що

Іноді вдається, виходячи з досвіду та здорового глузду, оцінити і більш тонкі відмінності між ступенями правдоподібності гіпотез.

Подібні методи суб'єктивної оцінки «імовірності-правдоподібності» різних гіпотез про стан природи іноді можуть допомогти при виборі рішення. Однак не можна забувати, що «оптимальне рішення обране на основі суб'єктивних ймовірностей, неминуче виявиться теж суб'єктивним. Ступінь суб'єктивності рішення можна зменшити, якщо замість ймовірностей призначених довільно однією особою, запровадити середні з таких ймовірностей, призначених незалежно один від одного групою кваліфікованих осіб («експертів»). Метод опитування експертів взагалі широко застосовується у сучасній науці, коли йдеться про оцінку невизначеної ситуації (наприклад, у футурології). Досвід застосування подібних методів вчить, що найчастіше оцінки експертів (прийняті незалежно одним від іншого) виявляються далеко не такими суперечливими, як це можна було припустити заздалегідь, і вивести з них деякі передумови для прийняття розумного рішення цілком можливо.

Вище ми висвітлили питання про вибір рішення на основі об'єктивно обчислених чи суб'єктивно призначених ймовірностей станів природи. Цей підхід у теорії рішень – не єдиний. Крім нього, існують ще кілька «критеріїв» або підходів до вибору оптимального рішення в умовах невизначеності. Зупинимося на деяких із них.

1. Максимальний критерій Вальда

Відповідно до цього критерію як оптимальну вибирається та стратегія гравця А, при якій мінімальний виграш максимальний, тобто стратегія, що гарантує за будь-яких умов виграш, не менший, ніж максимін:

(13.4)

Якщо керуватися цим критерієм, треба завжди орієнтуватися на найгірші умови та вибирати ту стратегію, для якої в найгірших умовах виграш максимальний. Користуючись таким критерієм в іграх із природою, ми ніби ставимо замість цієї безособової та незацікавленої інстанції активного та зловмисного супротивника. Очевидно, такий підхід може бути продиктований крайнім песимізмом в оцінці обстановки - «завжди треба розраховувати на гірше!» - але як один з можливих підходів заслуговує на розгляд.

2. Критерій мінімаксного ризику Севіджа

Сутність цього критерію полягає в тому, щоб будь-якими шляхами уникнути великого ризику при прийнятті рішення.

Критерій Севіджа, так само як і критерій Вальда - це критерій крайнього песимізму, але тільки песимізм тут розуміється по-іншому: найгіршим оголошується не мінімальний виграш, а максимальна втрата виграшу порівняно з тим, чого можна було б досягти за цих умов (максимальний ризик ).

3. Критерій песимізму-оптимізму Гурвіца

Цей критерій рекомендує в умовах невизначеності при виборі рішення не керуватися ні крайнім песимізмом (завжди розраховуй на гірше!) ні крайнім, легковажним оптимізмом (все обійдеться якнайкраще!) Критерій Гурвіца має вигляд:

де - коефіцієнт, що вибирається між нулем і одиницею.

Проаналізуємо структуру вираження (13.6). За умов Гурвіца перетворюється на песимістичний критерій Вальда, а при - на критерій «крайнього оптимізму», що рекомендує вибирати ту стратегію, для якої в найкращих умовахвиграш максимальний. При виходить щось середнє між крайнім песимізмом і крайнім оптимізмом (коефіцієнт і висловлює як би міру песимізму дослідника). Цей коефіцієнт вибирається з суб'єктивних міркувань - що небезпечніша ситуація, що більше хочемо у ній «підстрахуватися», тим ближче до одиниці вибирається і.

За бажання можна побудувати критерій, аналогічний критерію оптимізму-песимізму Гурвіца, виходячи не з виграшу, а з ризику, як у критерії Севіджа, але ми на цьому не зупинятимемося.

Незважаючи на те, що вибір критерію, як і вибір параметра в критерії Гурвіца, є суб'єктивним, все ж таки може виявитися корисним переглянути ситуацію з точки зору цих критеріїв. Якщо рекомендації, які з різних критеріїв, збігаються - тим краще, можна сміливо вибирати рекомендоване ними рішення. Якщо ж, як це часто буває, рекомендації суперечать один одному - завжди є сенс замислитися над цим і прийняти остаточне рішення з урахуванням його сильних та слабких сторін. Аналіз матриці гри з природою під кутом зору різних критеріїв часто дає краще уявлення про ситуацію, про переваги та недоліки кожного рішення, ніж безпосередній розгляд матриці, особливо коли її розміри великі.

Приклад 2. Розглядається гра з природою 4X3 із чотирма стратегіями гравця: і трьома варіантами умов (станів природи): Матриця виграшів наведена в табл. 13.2.

Таблиця 13.2

Знайти оптимальне рішення (стратегію), користуючись критеріями Вальда, Севіджа та критерієм Гурвіца при

Рішення. 1. Критерій Вальд.

У кожному рядку матриці беремо найменший виграш (табл. 13.3).

З величин максимальна (позначена зірочкою) дорівнює 0,25, отже, за критерієм Вальда оптимальною є стратегія

2. Критерій Севіджа.

Будуємо матрицю ризиків та поміщаємо у правому додатковому стовпці максимальний ризик у кожному рядку (табл. 13.4).

Мінімальним із значень є 0,60 (позначено зірочкою); отже, за критерієм Севіджа, оптимальною є будь-яка зі стратегій

Таблиця 13.3

3. Критерій Гурвіца

Записуємо у правих трьох стовпцях матриці (табл. 135) «песимістичну» оцінку виграшу «оптимістичну» а); та їх середнє виважене за формулою (13.6):

Таким чином, всі три критерії відповідно говорять на користь стратегії яку ми маємо всі підстави вибрати.(мінімум береться по всіх максимін в критерії Вальда) можна звичайними методами лінійного програмування Можуть бути випадки, коли застосування змішаних стратегій при користуванні критеріями Вальда, Севіджа, Гурвіца дасть перевагу в порівнянні з тим рішенням, де застосовуються одні чисті стратегії, проте ми будемо розглядати ці критерії стратегії.

Одна з причин цього - у тому, що ми хочемо уникнути складних обчислень, коли їх результат може бути зведений нанівець недоліком відомостей про ситуацію (незнання ймовірностей умов). Інша, більш важлива причина - у тому, що основний зміст теорії статистичних рішень (ми торкнемося його в наступному параграфі) - це планування отримання та використання додаткової інформації про стан природи, яку можна отримати шляхом експерименту. Дослідження показують, що у типових випадках, коли йдеться про отримання скільки-небудь значної кількості додаткової інформації, критерії, що не користуються ймовірностями станів (Вальда та ін), стають практично рівносильними критерію, заснованому на ймовірностях станів. Але ми знаємо, що при користуванні таким критерієм застосування змішаних стратегій немає сенсу; Отже, якщо ми можемо отримати скільки-небудь багато додаткової інформації, застосування змішаних стратегій втрачає сенс (хоч би яким критерієм вибору рішення ми користувалися). Якщо ж ми можемо, виробляючи експерименти, добувати нову інформацію, то різні критерії можуть давати рекомендації, що суперечать один одному, як ми бачили в прикладі 3.


1. Для кожного стану природи j (стовпця матриці) визначимо максимальне значення виграшу y j :

y j = max( x ij)

2. Для кожної клітини вихідної матриці X знайдемо різницю між максимальним виграшем r j для даного стану природи і результатом у осередку, що розглядається x ij :

r ij = y j - x ij

З отриманих значень складемо нову матрицю R - "матрицю жалю" або, як її ще можна назвати, матрицю недоотриманих виграшів.

3. Для кожної альтернативи у новій матриці R знайдемо найбільший можливий недоотриманий виграш ("максимальний жаль"). Це і буде оцінкою цієї альтернативи за критерієм Севіджа S i :

S i = max ( r ij)j=1..M

4. Оптимальною може бути визнана альтернатива з мінімальним (!) найбільшим недоотриманим виграшем:

Х * = Х k, S k = min ( S i), i=1..N

Приклад застосування критерію Севіджа

Застосуємо викладений вище алгоритм дій прийняття рішень на умовах завдання з табл. 3.

1. Знайдемо найбільшу можливу величину прибутку для кожного сценарію розвитку регіону:

y 1 = max (x 11 , x 21) = max (45, 20) = 45

y 2 = max (x 12 , x 22) = max (25, 60) = 60

y 3 = max (x 13 , x 23) = max (50, 25) = 50

2. Розрахуємо значення "жалю" для кожного проекту при кожному сценарії (тобто знайдемо недоотриманий прибуток порівняно з максимально можливим при даному сценарії розвитку). Складемо з отриманих значень "матрицю жалю" (табл. 4).

для проекту Х 1 :

r 11 = y 1 - x 11 = 45 - 45 = 0

r 12 = y 2 - x 12 = 60 - 25 = 35

r 13 = y 3 - x 13 = 50 - 50 = 0

для проекту Х 2 :

r 21 = y 1 - x 21 = 45 - 20 = 25

r 22 = y 2 - x 22 = 60 - 60 = 0

r 23 = y 3 - x 23 = 50 - 25 = 25

Таблиця 4

Матриця жалю R (для прикладу).

4. В отриманій матриці з кожного рядка знайдемо найбільшувеличину "жалю" для кожного проекту (останній стовпець у табл. 4). Це значення відповідає оцінці цієї альтернативи за критерієм Севіджа.

S 1 = max (0, 35, 0) = 35

S 2 = max (25, 0, 25) = 25

5. Порівняємо отримані величини та знайдемо проект з мінімальним (!) значенням критерію. Він і буде оптимальним:

35 > 25 => S 1 > S 2 => X * = X 2

ЛПР, який керується при прийнятті рішень критерієм Севіджа, вибере проект Х 2 .

Ще раз підкреслимо, що на відміну від інших критеріїв, найкращою альтернативою є та, для якої значення критерію Севіджа мінімальнооскільки критерій відображає найбільший з можливих недоотриманих виграшів для даної альтернативи. Зрозуміло, що менше можна недоотримати, тим краще.

Звичайний (або простий) критерій Гурвіцавраховує лише крайні результати x i maxі x i minкожної альтернативи:

x i max = max( x ij), x i min = min( x ij)j = 1..M

Він дозволяє врахувати суб'єктивне ставлення застосовує даний критерій ЛПР за рахунок надання цим результатам різних "ваг". Для цього в розрахунок критерію введено "Коефіцієнт оптимізму" λ, 0 ≤ λ ≤ 1 . Формула для розрахунку критерію Гурвіца для i -ї альтернативи з коефіцієнтом оптимізму λ виглядає наступним чином:

H i ( λ )= λ x i max + (1 - λ)x i min

Якщо результати є можливими виграшами, то оптимальною визнається альтернатива з максимальним значенням критерію Гурвіца:

Х * = Х k, H k ( λ ) = max( H i(λ )), i = 1.

Як видно з формули, правильний вибір коефіцієнта оптимізму λ істотно впливає на результат застосування критерію. Зупинимося докладніше на логіці підбору λ .

Якщо ЛПР налаштований песимістично, то для нього важливіше менше втратити за поганого розвитку подій, нехай навіть це означає не такий великий виграш при вдалому стані. Значить, питома вага найгіршого результату x i minв оцінці альтернативи повинен бути вищим, ніж для x i mах . Це забезпечується, коли λ знаходиться в межах від 0 до 0.5 , крім останнього значення.

При λ=0 Критерій Гурвіца "вироджується" за критерієм Вальда і підходить тільки для дуже песимістично налаштованих ЛПР.

Оптимістичний ЛПР, навпаки, орієнтується кращі результати, оскільки йому важливіше більше виграти, а чи не менше програти. Більша питома вага в оцінці найкращого результату досягається при λ більше 0.5 і до 1 включно. При λ=1 Критерій Гурвіца стає критерієм "максимаксу", який враховує виключно найбільший результат кожної альтернативи.

Якщо у ЛПР немає яскраво вираженого ухилу ні в бік песимізму, ні оптимізму, коефіцієнт λ приймається рівним 0.5 .

Приклад застосування критерію Гурвіца

У разі завдання з табл. 3 розглянемо прийняття рішення за критерієм Гурвіца для ЛПР, оптимістично налаштованого ( λ = 0.8 ), та ЛПР-песиміста ( λ = 0.3 ). Порядок дій такий:

1. Знайдемо максимальні x i maxта мінімальні x i minрезультати для кожного проекту:

x 1 max = max (45, 25, 50) = 50 х 1 min = min (45, 25, 50) = 25

x 2 max = max (20, 60, 25) = 60 x 2 min = min (20, 60, 25) = 20

2. Розрахуємо величину критерію Гурвіца при заданих значеннях коефіцієнта оптимізму:

ЛПР-оптиміст ( λ=0.8 ):

H 1 ( 0.8 )= λ x 1 max + (1 - λ)x 1 min = 0.8×50 +(1 - 0.8 )×25 = 45

H 2 ( 0.8 )= λ x 2 max + (1 - λ)x 2 min = 0.8×60 +(1 - 0.8 )×20 = 52

ЛПР-песиміст ( λ=0.3 ):

H 1 ( 0.3 )= λ x 1 max + (1- λ)x 1 min = 0.3×50 +(1 - 0.3 )×25 = 32.5

H 2 ( 0.3 )= λ x 2 max + (1- λ)x 2 min = 0.3×60 +(1 - 0.3 )×20 = 32

3. Порівняємо отримані величини. Оптимальними для кожного ЛПР будуть альтернативи з максимальним значеннямкритерію Гурвіца:

ЛПР-оптиміст ( λ = 0.8 ):

45 < 52 =>H 1 (0.8)< H 2 (0.8) =>X* = X 2

ЛПР-песиміст ( λ = 0.3 ):

32.5 < 32 =>H 1 (0.3) > H 2 (0.3) => X * = X 1

Як бачимо, вибір оптимальної альтернативи в тих самих умовах істотно залежить від ставлення ЛПР до ризику. Якщо для песиміста обидва проекти приблизно рівноцінні, то оптиміст, який сподівається на краще, вибере другий проект. Його високий найкращий прибуток ( 60 ) при великих значеннях коефіцієнта λ значно підвищує цінність цього проекту за критерієм Гурвіца.

Недоліком звичайного критерію Гурвіца є "нечутливість" до розподілу результатів між крайніми значеннями. Це може призводити до неправильним рішенням. Наприклад, альтернатива А(100; 150; 200; 1000) за критерієм Гурвіца з "оптимістичним" коефіцієнтом λ = 0.7 краще альтернативи В(100; 750; 850; 950) , так як:

H А (0.7) = 0.7 1000 + (1 - 0.7) 100 = 730

H (0.7) = 0.7×950 + (1 - 0.7)× 100 = 695

Однак, якщо подивитися уважніше на можливості, які надає В , то стає помітно, що вона вигідніша. Її "внутрішні" результати ( 750 і 850 ) істотно краще, ніж у А (150 та 200) , а максимальний виграш лише трохи гірший ( 950 проти 1000 ). У реальному житті логічніше було б вибрати В .

Принцип побудови узагальненого критерію Гурвіцасхожий на попередній. Усім прийнятим до уваги результатам привласнюється деяка "питома вага". Значення критерію альтернативи розраховується як виважена сума її результатів. Проте, щоб уникнути недоліків "попередника", узагальнений критерій враховує всі результати кожної альтернативи.

Тоді, формула для розрахунку узагальненого критерію для i -й альтернативи може бути записана наступним чином:

λ q- Коефіцієнт для q -го значення i -ї альтернативи,

0≤λ q ≤1, λ 1 + ... + λ q + ... + λ М = 1

Виходить, що для використання узагальненого критерію Гурвіца необхідно призначити М (!) Коефіцієнтів λ q . Звичайно, можна було б це зробити довільно. Але при великій кількості станів М це стає дуже трудомістким, тому що необхідно, щоб коефіцієнти задовольняли як мінімум двом умовам:

1) сума всіх вагових коефіцієнтів повинна дорівнювати одиниці:

2) величини коефіцієнтів повинні відображати ставлення ЛПР до невизначеності:

а) для оптимістичного ЛПР кращі результати повинні мати більшу "вагу", причому, чим кращий результат, тим більше "вага";

б) для песимістичного ЛПР - все навпаки - більша "вага" у гірших результатів, і чим гірший результат - тим більше "вага":

Щоб не призначати коефіцієнти довільно окремо, були запропоновані формалізовані методи їх розрахунку, один і яких ми і розглянемо нижче.

Ухвалення рішень в умовахневизначеності

1. Максимальний критерій Вальда.

2. Критерій Севіджа (мінімаксного ризику).

3. Критерій Гурвіца (песимізму-оптимізму).

1. Максимальний критерій Вальда (критерій крайнього песимізму)

(«розраховуй на найгірше»)

У групу критеріїв вибору оптимальної стратегії статистика, що застосовуються при невідомих апріорних ймовірностях станів природи , входять критерії Вальда, Севіджа та Гурвіца. Вони застосовують аналіз платіжної матриці чи матриці ризиків.

Якщо розподіл ймовірностей майбутніх станів природи невідомо, то вся інформація про природу зводиться до переліку її можливих станів.

Максимальний критерій Вальда– це критерій крайнього песимізму,або критерій обережного спостерігачаЙого можна сформулювати як чистих, так змішаних стратегій.

Критерій Вальда є критерієм крайнього песимізму, оскільки статистик припускає, що природа реалізує такі стани, у яких величина його виграшу набуває найменшого значення.

Критерій тотожний максимінному (песимістичному) критерію,що використовується при вирішенні матричних ігор у чистих стратегіях.

З кожної рядкивибираються мінімальніелементи, тобто. які відповідають найгіршому результату ЛПР за відомих станів «природи» . Потім вибирається стратегіяЛПР, відповідна максимальному елементу з відібраних мінімальних:

. (1)

Вибрані таким чином варіанти повністю виключають ризик, оскільки ЛПР не може зіткнутися з найгіршим результатом, ніж той, який він орієнтується.

Застосування цього критеріювиправдано, якщо ситуація, у якій приймається рішення, характеризується такими ознаками:

    ймовірність станів «природи» невідомі;

    рішення реалізується лише один раз або мала кількість разів;

    повна неприпустимість ризику.

Таким чином, оптимальною за критерієм Вальда вважається чиста стратегія, яка за найгірших умов гарантує максимальний виграш. Значить, оптимальною буде максимінна чиста стратегія, а максимальним виграшем – нижня чиста ціна гри у парній грі з нульовою сумою.

приклад 1.

Гра "Постачальник".

Випуск продукції фірми істотно залежить від матеріалу, що швидко псується, наприклад, молока або ягід, що поставляється партіями вартістю 100од.

Якщо постачання не прибуває вчасно, фірма втрачає 400 од. від недовипуску продукції.

Фірма може надіслати до постачальника свій транспорт (витрати 50 од.), проте досвід показує, що у половині випадків транспорт повертається ні з чим.

Можна збільшити ймовірність отримання матеріалу до 80%, якщо попередньо надіслати свого представника, але витрати збільшаться ще на 50 од.

Існує можливість купувати більш дорогий (на 50%) матеріал-замінник у іншого, цілком надійного постачальника, однак, крім витрат на транспорт (50 од.) можливі додаткові витрати на зберігання матеріалу в розмірі 30 од., якщо його кількість на складі перевищить допустиму норму , рівну одній партії.

Якої стратегії повинен дотримуватися завод у ситуації?

Рішення

У природи два стани: постачальник надійний та постачальник ненадійний. У фірми - чотири стратегії: 1) не здійснювати жодних додаткових дій; 2) послати до постачальника свій транспорт; 3) послати до постачальника представника та транспорт; 4) купити та привезти матеріал-замінник від іншого постачальника.

Складемо таблицю розрахунків:

Витрати та збитки фірми-виробника

Ситуація

Вартість матеріалу

Недопуск продукції

Транспорт

Витрати на відрядження

Недоліки

Загальна сума

Рішення

На основі отриманих результатів обчислень можна скласти платіжну матрицю:

Відповідь. Потрібно дотримуватися третьої стратегії та витрати не перевищать 260 од., якщо надіслати до постачальника представника та транспорт.

1 . Розглянутий спосіб пошуку оптимального рішення є критерійВальда ( максимальний критерійприйняття рішення). Вибирається рішення, що гарантує отримання виграшу не менше ніж maxmin:

од.

Застосовуючи цей критерій ми представляємо дома природи активного і зловмисного противника. Це песимістичний підхід .

2. Максимаксний критерій. Найсприятливіший випадок:

од.

Якщо фірма нічого не зробить, то витратить не більше 100 одиниць. Це критерій абсолютного оптимізму.

Критерій Вальда для змішаних стратегій

Оптимальною вважається та змішана стратегія статистика , за якої мінімальний середній виграш буде максимальним: . (2)

Критерій Вальда орієнтують статистика на найнесприятливіші стани природи, тобто висловлюють песимістичну оцінку ситуації.

2. Критерій Севіджа (мінімаксного ризику )

На практиці, вибираючи одне з можливих рішень, часто зупиняються на тому, здійснення якого призведе до найменш тяжких наслідківякщо вибір виявиться помилковим. Цей підхід до вибору рішення математично був сформульований американським статистиком Севіджем у 1954 році та отримав назву принципу Севіджа. Він особливо зручний для економічних завдань і часто застосовується для вибору рішень в іграх з природою.

За принципом Севіджа кожне рішення характеризується величиною додаткових втрат, що виникають під час реалізації цього рішення, в порівнянні з реалізацією рішення, правильного при даному стані природи.Звичайно, правильне рішення не тягне за собою ніяких додаткових втрат, і їхня величина дорівнює нулю.

При виборі рішення, що найкраще відповідає різним станам природи, слід брати до уваги лише ці додаткові втрати, які, по суті, будуть наслідком помилок вибору.

Для вирішення задачі будується так звана « матриця ризиків», елементи якої показують, який збиток зазнає гравець (ЛПР) у результаті вибору неоптимального варіанта рішення.

Нагадаємо, що Ризиком гравця при виборі стратегії в умовах (станах) природиназивається різниця між максимальним виграшем, який можна отриматиу цих умовах, і виграшем, який отримаєгравець у тих самих умовах, застосовуючи стратегію.

Критерій Севіджа - це критерій мінімального ризику, мінімізації «жалювань».Цей критерій як критерій Вальда є максимально обережним і песимістичним.

У критерії Севіджа песимізм проявляється по-іншому: найгіршим вважається не мінімальний виграш, а максимальна втрата виграшу порівняно з тим, що можна було б досягти за цих умов (максимальний ризик).

Критерій Севіджа орієнтується не так на результат, але в ризик(Втрати або штрафи) .

Як оптимальна вибирається стратегія, при якій величина втрат у найгірших умовах мінімальна.Критерій Севіджа рекомендує вибирати як оптимальноюту стратегію, яка мінімізує максимальний ризик:

Вимоги, що пред'являються ситуації, у якій приймається рішення за критерієм Севіджа, збігаються з вимогою використання критерію Вальда. Критерій Севіджа, як і критерій Вальда, орієнтує статистика на найнесприятливіші стани природи.

приклад 2.Для завдання «Постачальник» мінімакс ризику досягається відразу за двох стратегій А 2 і А 3:

Знайти оптимальне рішення гри , застосовуючи критерій Севіджа.

Рішення.

Орієнтуємось на найнесприятливіші стани «природи». Обчислимо ризики статистики.

Для першого стовпця:

Для другого стовпця:

Для третього стовпця:

Запишемо матрицю ризиків.

Стратегії статистика

Визначимо у кожному рядкунайбільше – найбільший ризик статистика , якщо він застосовує стратегію , а природа змінює свої стани , , . Доповнимо матрицю ризиків останнім стовпцем «найбільші ризики».

Матриця ризиків та найбільші ризики

Стратегії статистика

Найбільші ризики

Знайдемо найменший ризик: .

Отже, оптимальною стратегією за критерієм Севіджа є стратегія .

4.3. Критерій Гурвіца (песимізму-оптимізму)

Критерій Гурвіца – критерій узагальненого максимуму, або песимізму-оптимізму.

Звісно ж логічним, що з виборі рішення замість двох крайнощів у оцінці ситуації дотримуватися певної проміжної позиції, враховує можливість як найгіршого, і найкращого, сприятливого поведінки природи.

Такий компромісний варіант був запропонований Гурвіцем. Відповідно до цього підходу для кожного рішення необхідно визначити лінійну комбінацію min і max виграшу і взяти ту стратегію, на яку ця величина виявиться найбільшою.

Цей критерій забезпечує проміжне рішення між крайнім оптимізмом та крайнім песимізмом, Яке визначається за принципом:

. (4)

Число () - ступінь оптимізму , задовольняє умові та вибирається із суб'єктивних міркувань, особливостей середовища, здорового глузду, виходячи з досвіду ЛПР, його ставлення до ризику тощо. На вибір значення ступеня оптимізму впливає міра відповідальності: чим серйознішими є наслідки помилкових рішень, тим більше бажання приймаючого рішення застрахуватися, тобто ступінь оптимізму  ближче до нуля.

Для кожної рядкирозраховується середнє виважене(з урахуванням вибраного значення ) найменшого та найбільшого результатів, після чого вибирається рядок із максимальним значенням.

При маємо критерій крайнього оптимізму, тобто. відображає позицію азартного гравця, який чекає на найбільш сприятливий стан середовища.

За умов Гурвіца перетворюється на критерій крайнього песимізму Вальда.

Якщо 0 - проміжне відношення ЛПР до можливих ризиків. За бажання підстрахуватися у цій ситуації приймають близьким до одиниці.

Вибір значення суб'єктивний, отже, суб'єктивний і вибір рішення, що неминуче за умов невизначеності.

Чим небезпечніша ситуація, тим більше ЛПР прагне застрахувати себе від можливих ризиків, тим ближче до 0. Чим він азартен, тим ближче до 1.

Оптимальна за Гурвіц стратегія повинна гарантувати статистику більший виграш порівняно з виграшем, який статистиком інтуїтивно або виходячи з досвіду.

Застосування критерію Гурвіца є виправданим, якщо ситуація, в якій приймається рішення, характеризується ознаками:

    ймовірність станів природи невідомі;

    рішення реалізується мала кількість рішень;

    допускається певний ризик.

Приклад 3.Знайти оптимальне рішення статистичної гри, заданої платіжною матрицею, використовуючи критерій Гурвіца.

Рішення.

Для застосування критерію Гурвіцапотрібно знати значення ймовірності. Нехай, наприклад, . Це означає, що подія «найменший можливий виграш статистика» бажаємо зробити більш правдоподібною (близько до одиниці), тобто страхуємось від несприятливих ситуацій у грі. Тоді

Запишемо всі проміжні результати до таблиці.

З останнього стовпця таблиці видно, що максимальне значення дорівнює (-7,2) і відповідає чистій стратегії ; вона і буде оптимальною за критерієм Гурвіца.

Аналіз практичних ситуацій проводиться за декількома критеріями одночасно, що дозволяє глибше досліджувати суть явища та вибрати найбільш обґрунтоване управлінське рішення. Як оптимальна на підставі сукупних дослідженьбереться та стратегія, яка найчастіше називалася оптимальною за всіма критеріями.

Вибір критерію (як і вибір принципу оптимальності) є найважчим і найвідповідальнішим завданням у теорії прийняття рішень. Однак конкретна ситуація ніколи не буває настільки невизначеною, щоб не можна було отримати хоча б часткову інформацію щодо ймовірнісного розподілу станів природи. У цьому випадку, оцінивши розподіл ймовірностей станів природи, застосовують метод Байєса-Лапласа або проводять експеримент, що дозволяє уточнити поведінку природи.

Контрольні питання

    Що розуміється під іграми із природою?

    Якими критеріями користується статистик визначення своєї оптимальної стратегії за умов невизначеності?

    Що розуміється під ризиком гравця?

    Поясніть принципи використання моделей теорії ігор в економічних задачах за умов невизначеності (ігри з природою).

  1. умовах невизначеності, що використовує апарат нечіткою...
  2. Прийняття рішеньв умовахневизначеності (5)

    Реферат >> Держава та право

    Ситуацією ризику, а іншого – невизначеності. Ризик прийняттянайгіршого рішенняв умовахколи відомі всі вихідні... тому, що в процесі прийняття рішеньдоводиться здійснювати вибір у умовах невизначеності.. Процедури та методи системного...

  3. Прийняттяуправлінських рішеньв умовахризику та невизначеності

    Реферат >> Менеджмент

    ... Прийняттяуправлінських рішеньв умовахризику та невизначеності. План: Введення. Джерела та види невизначеності. Прийняття рішеньв умовах невизначеності... та види невизначеності. Прийняття

Коротка теорія

Будь-яку господарську діяльність людини можна як гру з природою. У широкому значенні під природою розумітимемо сукупність невизначених факторів, що впливають на ефективність прийнятих рішень.

Управління будь-яким об'єктом здійснюється шляхом ухвалення послідовності управлінських рішень. Для прийняття рішення необхідна інформація (сукупність відомостей про стан об'єкта управління та умови його роботи). У тих випадках, коли відсутня досить повна інформація, виникає невизначеність у прийнятті рішення. Причини цього можуть бути різні: потрібна для повного обґрунтування рішення інформація не може бути отримана (непереборна невизначеність); інформація може бути отримана своєчасно, на момент прийняття рішення; витрати, пов'язані з отриманням інформації, надто високі. У міру вдосконалення засобів збору, передачі та обробки інформації невизначеність управлінських рішень буде зменшуватися. До цього треба прагнути. Існування непереборної невизначеності пов'язане з випадковим характером багатьох явищ. Наприклад, у торгівлі, випадковий характер зміни попиту унеможливлює його точне прогнозування, а, отже, і формування ідеально точного замовлення на поставку товару. Ухвалення рішення у разі пов'язані з ризиком. Приймання партії товару виходячи з вибіркового контролю також пов'язані з ризиком прийняття рішення за умов невизначеності. Невизначеність може бути знята шляхом повного контролю всієї партії, проте це може виявитися надто дорогим заходом. В сільському господарстві, наприклад, з метою отримання врожаю людина робить ряд дій (оре землю, вносить добрива, бореться з бур'янами тощо). Остаточний результат (урожай) залежить від дій не тільки людини, а й природи (дощ, посуха, вечір тощо). З наведених прикладів видно, що повністю виключити невизначеність в управлінні економічною системою не можна, хоча, повторимо, цього потрібно прагнути. У кожному конкретному випадку слід брати до уваги рівень ризику при прийнятті управлінських рішень, по можливості максимально враховувати наявну інформацію з метою зменшення несприятливих наслідків, які можуть виникнути через помилкові рішення.

Дві сторони, що беруть участь у грі, називатимемо гравець I та гравець II. Кожен із гравців має у своєму розпорядженні кінцевий набір дій (чистих стратегій), які він може застосовувати в процесі гри. Гра має циклічний характер, що повторюється. Про кожен цикл гравці вибирають одну зі своїх стратегій, що однозначно визначає платіж. Інтереси гравців протилежні. Гравець I намагається вести гру так, щоб платежі були якомога більшими. Для гравця II бажані якомога менші значення платежів (з урахуванням знака). Причому у кожному циклі виграш одного з гравців точно збігається з програшем іншого. Ігри такого типу називаються іграми з нульовою сумою.

Вирішити гру - значить визначити оптимальну поведінку гравців. Вирішення ігор є предметом теорії ігор. Оптимальна поведінка гравця є інваріантною щодо зміни всіх елементів платіжної матриці на деяку величину.

У випадку визначення оптимального поведінки гравців пов'язані з рішенням двоїстої пари завдань лінійного програмування. В окремих випадках можуть бути використані простіші методи. Часто платіжну матрицю вдається спростити шляхом видалення з неї рядків і стовпців, що відповідають домінованим стратегіям гравців, домінованою називається стратегія, всі платежі якої не кращі за відповідні платежі деякої іншої стратегії і хоча б один з платежів гірший за відповідний платеж цієї іншої стратегії, званої домінуючої.

У звичайній стратегічній грі беруть участь «розумні та антагоністичні» супротивники (протиборчі сторони). У таких іграх кожна зі сторін робить саме ті дії, які найвигідніші їй і менш вигідні противнику. Однак дуже часто невизначеність, що супроводжує деяку операцію, не пов'язана зі свідомою протидією противника, а залежить від якоїсь невідомої гравцеві I об'єктивної дійсності (природи). Такі ситуації прийнято називати іграми з природою. Гравець II - природа - теоретично статистичних ігор перестав бути розумним гравцем, оскільки розглядається як якась незацікавлена ​​інстанція, яка вибирає собі оптимальних стратегій. Можливі стани природи (її стратегії) реалізуються випадковим чином. У дослідженні операцій оперуючу сторону (гравця I) часто називають статистиком, а самі операції – іграми статистика з природою чи статистичними іграми.

Розглянемо ігрову постановку завдання прийняття рішення за умов невизначеності. Нехай оперуючій стороні необхідно виконати операцію в недостатньо відомій обстановці щодо станів якої можна зробити припущення. Ці припущення розглядатимемо як стратегії природи. Оперуюча сторона у своєму розпорядженні має можливі стратегії - . Виграші гравця I при кожній парі стратегій-передбачаються відомими і задані платіжною матрицею.

Завдання полягає у визначенні такої стратегії (чистої або змішаної), яка на її застосуванні забезпечила б оперуючій стороні найбільший виграш.

Вище говорилося, що господарську діяльність людини можна розглядати як гра з природою. Основною особливістю природи як гравця є її не зацікавленість у виграші.

Аналіз матриці виграшів гри з природою починається з виявлення та відкидання дублюючих та свідомо невигідних стратегій особи, що грає з природою. Що стосується стратегій природи, то жодну з них відкинути не можна, тому що кожен із станів природи може наступити випадковим чином, незалежно від дій гравця I. З огляду на те, що природа не протидіє гравцю I, може здатися, що гра з природою простіше стратегічної гри. Насправді, це не так. Протилежність інтересів гравців у стратегічній грі в певному сенсі ніби знімає невизначеність, чого не можна сказати про статистичну гру. Оперуючій стороні у грі з природою легше у тому відношенні, що вона швидше за все виграє більше, ніж у грі проти свідомого супротивника. Проте їй важче прийняти обґрунтоване рішення, оскільки у грі з природою невизначеність ситуації позначається значно сильнішою мірою.

Після спрощення платіжної матриці гри з природою доцільно не лише оцінити виграш за тієї чи іншої ігрової ситуації, але й визначити різницю між максимально можливим виграшем при даному стані природи та виграшем, який буде отримано при застосуванні стратегії в тих самих умовах. Ця різниця теоретично ігор називається ризиком.

Природа змінює стан стихійно, зовсім не переймаючись результатом гри. В антагоністичній грі ми припускали, що гравці користуються оптимальними (у певному сенсі) змішаними стратегіями. Можна припустити, що природа застосовує, напевно, не оптимальну стратегію. Тоді яку? Якби існувала відповідь на це питання, то прийняття рішення особою, яка приймає рішення (ЛПР), зводилося б до детермінованого завдання.

Якщо ймовірності станів природи відомі, то користуються критерієм Байєса, відповідно до якого оптимальною вважається чиста стратегія, за якої максимізується середній виграш:

Критерій Байєса припускає, що нам хоч і невідомі умови виконання операцій (стану природи), але відомі їх ймовірності.

За допомогою такого прийому завдання про вибір рішення в умовах невизначеності перетворюється на задачу про вибір рішення в умовах визначеності, тільки прийняте рішення є оптимальним не в кожному окремому випадку, а в середньому.

Якщо гравцеві є рівною мірою правдоподібними всі стани природи, то іноді вважають і, враховуючи, «принцип недостатньої основи» Лапласа, оптимальною вважають чисту стратегію, що забезпечує:

Якщо ж змішана стратегія природи невідома, то, залежно від гіпотези про поведінку природи, можна запропонувати ряд підходів для обґрунтування вибору рішення ЛПР. Свою оцінку характеру поведінки природи характеризуватимемо числом , яке можна пов'язувати зі ступенем активного «противодії» природи як гравця Значення відповідає найбільш песимістичному відношенню ЛПР у сенсі «сприяння» природи у досягненні ним найкращих господарських результатів. Значення відповідає найбільшому оптимізму ЛПР. Як відомо, у господарській діяльності зазначені крайнощі небезпечні. Швидше за все, доцільно виходити з деякого проміжного значення. У цьому випадку використовується критерій Гурвіца, згідно з яким найкращим рішенням ЛПР є чиста стратегія, що відповідає умові:

Критерій Гурвіца (критерій «оптимізму-песимізму») ​​дозволяє керуватися при виборі ризикового вирішення в умовах невизначеності деяким середнім результатом ефективності, що знаходиться в полі між значеннями за критеріями «максимаксу» і «максиміна» (поле між цими значеннями пов'язане за допомогою опуклої лінійної функції).

Що стосується крайнього песимізму ЛПР зазначений критерій називається критерієм Вальда. Відповідно до цього критерію, найкращою вважається максимінна стратегія. Це критерій крайнього песимізму. За цим критерієм ЛПР вибирає ту стратегію, яка гарантує у найгірших умовах максимальний виграш:

Такий вибір відповідає найбільш боязкому поведінці ЛПР, що він передбачає найбільш, несприятливе поведінка природи, боїться великих втрат. Можна припустити, що вона не отримає великих виграшів. Згідно з критерієм Севіджа, слід обирати чисту стратегію, яка відповідає умові:

де ризик.

Критерій Севіджа (критерій втрат від "мінімаксу") передбачає, що з усіх можливих варіантів "матриці рішень" вибирається та альтернатива, яка мінімізує розміри максимальних втрат за кожним із можливих рішень. При використанні цього критерію "матриця рішення" перетворюється на "матрицю ризику", в якій замість значень ефективності проставляються розміри втрат при різних варіантах розвитку подій.

Недоліком критеріїв Вальда, Севіджа та Гурвіца є суб'єктивна оцінка поведінки природи. Хоча зазначені критерії і дають деяку логічну схему прийняття рішень, резонно все ж таки поставити питання: «А чому відразу не вибрати суб'єктивне рішення, замість того, щоб мати справу з різними критеріями?» Безперечно, визначення рішення за різними критеріями допомагає ЛПР оцінити прийняте рішення з різних позицій та уникнути грубих помилок у господарській діяльності.

Приклад розв'язання задачі

Умова задачі

Після кількох років експлуатації обладнання може опинитися в одному із трьох станів:

  1. потрібен профілактичний ремонт;
  2. потрібна заміна окремих деталей та вузлів;
  3. потрібен капітальний ремонт.

Залежно від ситуації керівництво підприємства може ухвалити такі рішення:

Потрібно знайти оптимальне вирішення цієї проблеми за критерієм мінімізації витрат з урахуванням таких припущень:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

Рішення задачі

Гра парна, статистична. У грі беруть участь 2 гравці: керівництво підприємства та природа.

Під природою у разі розуміємо сукупність зовнішніх чинників, які визначають стан устаткування.

Стратегія керівництва:

Відремонтувати обладнання самотужки

Викликати бригаду спеціалістів

Замінити обладнання новим

Стратегія природи - 3 можливі стани обладнання.

Потрібен профілактичний ремонт;

Слід замінити окремі деталі та вузли;

Потрібний капітальний ремонт.

Розрахунок платіжної матриці та матриці ризиків

Оскільки елементи матриці - витрати, то вважатимемо їх виграшними, але зі знаком мінус. Платіжна матриця:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

Складаємо матрицю ризиків:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

Критерій Байєса

Визначаємо середні виграші:

За критерієм Байєса оптимальною є стратегія – викликати бригаду фахівців

Критерій Лапласа

Визначимо середні виграші:

За критерієм Вальда оптимальною є стратегія – викликати бригаду фахівців

Критерій Севіджа

За критерієм Севіджа оптимальною є стратегія – замінити обладнання на нове

Критерій Гурвіца

За критерієм Гурвіца оптимальною є стратегія – викликати бригаду фахівців

Відповідь

За всіма критеріями, крім критерію Севіджа, оптимальною є стратегія «Викликати бригаду фахівців». За критерієм Севіджа, який мінімізує ризики, оптимальною є стратегія замінити обладнання новим.