В настоящее время известен широкий спектр методов и моделей эффективного выбора альтернатив, объединяемых в рамках дисциплины, именуемой “Теория принятия решений”. Подавляющее большинство описанных моделей методологически обоснованы и значительная их часть проверена на практике, доказав достаточно высокую эффективность их использования. Тем не менее, ряд базовых моделей в их классической постановке имеют определенные ограничения, сужающие возможную область их применения и снижающих достижимую эффективность их использования. Цель настоящей работы – предложить подход, позволяющий снять указанные ограничения путем модификации известных моделей. Использование предлагаемого подхода может повысить эффективность моделей и придать им определенную универсальность
Базовые модели классической теории принятия решений
Любая сфера человеческой деятельности, в особенности экономика, медицина или бизнес, связана с принятием решений в условиях неполноты информации. Источники неопределенности могут быть самые разнообразные:
нестабильность экономической и/или политической ситуации;
неоднозначность связи наблюдаемых симптомов с истинным характером заболевания наблюдаемого больного;
неопределенность действий партнеров по бизнесу, случайные факторы, т.е. большое число обстоятельств, учесть которые не представляется возможным, например, погодные условия, неопределенность спроса на товары;
недостаточная надежность процессов производства, неточность информации и др.
Решения с учетом перечисленных и множества других неопределенных факторов принимаются в рамках так называемой теории принятия решений – аналитического подхода к выбору наилучшего действия (альтернативы) или последовательности действий. В зависимости от степени определенности возможных исходов или последствий различных действий, с которыми сталкивается лицо, принимающее решение, в теории принятия решений рассматриваются три типа моделей:
– выбор решений в условиях определенности, если относительно каждого действия известно, что оно неизменно приводит к некоторому конкретному исходу;
– выбор решения при риске, если каждое действие приводит к одному из множества возможных частных исходов, причем каждый исход имеет вычисляемую или экспертно оцениваемую вероятность появления;
– выбор решений при неопределенности, когда то или иное действие или несколько действий имеют своим следствием множество частных исходов, но их вероятности зависят от состояния окружающей среды.
Методы принятия решений в условиях риска разрабатываются и обосновываются в рамках теории статистических решений, одним из базовых понятий которой является понятие платежной матрицы – одно из базовых понятий в теории игр. В теории игр платежная матрица используется для выбора оптимальной стратегии и для двух игроков представляется в виде таблицы 1, где приняты следующие обозначения:
A1 …Am– стратегии игрока A;
B1 …Bn– стратегии игрока B;
Стратегия игрока B
B1 B2 …Bn
Стратегия
игрока
A
A1
A2
…
Am
a11 a12 …a1n
a21 a22 …a2n
… … … …
am1 am2 …amn
Табл. 1. Матрица платежей
a11 … amn– платежи игроков на пересечениях i – й строки и j – го столбца. Так, если игрок A выберет стратегию A2, а игрок B -стратегию Bn, то игрок A выигрывает (проигрывает) у игрока B сумму a2n.
Анализируя матрицу платежей, игрок получает возможность выбрать оптимальную стратегию, ориентируясь на максимизацию своего выигрыша или на минимизацию возможного проигрыша.
Принятие управленческих решений также предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока, однако при наступлении некоторых из ее состояний, проигрыш становится неизбежным. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.
Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой». Игрок в этой игре называется лицом, принимающим решение (ЛПР). Создателем теории статистических решений считается А. Вальд.
Абрахам Вальд (1939), показал, что две центральных проблемы ортодоксальной статистической теории, а именно, статистическое испытание гипотез и статистическая теория оценивания, могли бы быть расценены как специфические специальные случаи более общей теории принятия решений. Эта работа вводила большую часть «ментального пейзажа» современной теории принятия решений, включая функции потерь, функции риска, допустимые решающие правила, априорные распределения, байесовские правила решения, и минимаксные решающие правила. Термин «теория принятия решений» непосредственно начал использоваться в 1950 году Э. Л. Леманном.
Теория статистических решений представляет ЛПР как лицо, производящее выбор из совокупности альтернативA = {a1, a2, ..., am} при условии, что заданы:
1. Набор состояний окружающей среды S = {s1, s2, ..., sn}, факт наступления которых не поддаются управлению, но вероятности их наступлений P= {p1, p2, ..., pn} известны (то есть состояние s1 будет иметь место с вероятностью p1и т. д.).
2. Задана матрица платежей в терминах затрат или выигрышей Vij, ассоциированных с каждой парой “альтернатива - состояние окружения”.
Если решение принимается в условиях частичной неопределенности, то, согласно теории принятия решений, статистические игры являются основным подходом.
Основными отличиями статистической игры от игры стратегической являются:
– отсутствие стремления к выигрышу у игрока-«окружающей среды», т. е. отсутствие антагонистического противника;
– возможность для игрока – «ЛПР» провести статистический эксперимент для получения дополнительной информации о стратегиях природы.
Таким образом, теория статистических решений является теорией проведения статистических наблюдений, обработки этих наблюдений и их использования.
В теории статистических решений основные правила могут быть детерминированными и рандомизированными.
ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи.
Окружающая среда
s1s2 … sn
Ожидаемая
ценность
альтернативы
Вероятности наступления
p1 p2 …pn
Альтернативы
Альтернатива a1
Альтернатива a1
…
Альтернатива a1
v11 v12 …v1n
v21 v22 …v2n
… … … …
vm1 vm2 …vmn
Таблица 2. Матрица решений статистической игры
Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Vi) приписывается некоторый результат E(Vi), характеризующий все последствия этого решения. Из массива iрезультатов принятия решений ЛПР выбирает элемент E(Vij), который наилучшим образом отражает мотивацию его поведения.
В тех случаях, когда ЛПР известны вероятности состояний окружающей среды, применяется критерий максимального математического ожидания выигрыша. Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:
Если все перечисленные выше элементы матрицы платежей заданы, то предпочтительная альтернатива может быть определена вычислением математического ожидания ценности E(Vi) каждой из рассматриваемых альтернатив по формуле:
и последующим выбором альтернативы, имеющей наибольшую ожидаемую ценность
Термин, теперь известный как «ожидаемая ценность» (математическое ожидание ценности), был известен с 17-ого столетия. Блез Паскаль использовал этот термин в его известном пари, которое описано в его работе «Pensées», изданной в 1670. Понятие ожидаемой ценности предлагается применять в ситуации, когда каждое из решений может с различными вероятностями привести к нескольким возможным исходам. Рациональная процедура должна идентифицировать все возможные исходы, определить их ценности (положительные или отрицательные) и вероятности их наступления. Затем следует перемножить соответствующие ценности и вероятности и сложить, чтобы дать в итоге «ожидаемую ценность». Действие, которое будет выбрано, должно обеспечить наибольшую ожидаемую ценность.
Следовательно, теория статистических решений сводит проблему анализа альтернатив к анализу содержащейся в них мотивировкии предлагает считать наиболее предпочтительной ту альтернативу, для которой математическое ожидание мотивировки имеет наибольшее значение.
Однако, в общем случае, многие ситуации выбора не могут быть удовлетворительно описаны моделью анализа альтернатив в классической постановке вследствие множественности критериев, которые подлежат учету в этой модели. Поэтому достаточно широкое распространение получили модифицированные (или расширенные) модели анализа альтернатив.
Расширенная модель анализа альтернатив
Расширенная модель анализа альтернатив была получена на базе классической модели путем внесения следующих изменений:
Заменой nсостояний окружающей среды набором целевых показателей
G= {G1, G2. ..., Gn}, которые ЛПР желает достигнуть;
2. Заменой платежной матрицы матрицей вероятностей pij, характеризующих шансы на достижение каждого из целевых состояний при реализации каждой из исследуемых альтернатив;
Оценки целевых
показателей (мотивировки)
w1
w2
…
wn
Ценность
альтернативы
E(Vi)
Целевые показатели
G1
G2
…
Gn
Альтер-нативы
Альтернатива a1
p11
p11
…
p1n
Альтернатива a2
p11
p11
…
p2n
Альтернатива a1
…
…
…
…
Альтернатива am
p11
p11
…
pmn
Таблица 3. Модифицированная матрица решений
3. Заменой вектора вероятностей реализации состояния окружающей среды на вектор, элементами которого является относительная оценка или кардинальный ранг каждого из назначаемых целевых показателей W = {w1, w2, ..., wn}.
Таким образом, в модифицированной модели ЛПР освобождается от необходимости устанавливать количественную меру мотивировки для каждой пары “альтернатива - состояние окружения”, задавая платежную матрицу. Вместо этого он оценивает мотивировку, содержащуюся в каждой из альтернатив, на основе ожидаемого вклада этой альтернативы в достижение целей более высокого порядка, мотивировка которых задана извне в виде вектора W. Естественно, что в ряде случаев это существенно упрощает проблему для ЛПР, освобождая его от ответственности за назначение оценок мотивировки и сводя задачу просто к логическому анализу.
Структура модифицированной модели представлена таблицей 3. В соответствии с этой моделью наиболее предпочтительной альтернативой является та, которая доставляет максимум полезности (или мотивировки):
.
По существу, в расширенной модели используется та же самая платежная матрица, как и классической постановке. Действительно, в обоих случаях вклад каждого ij–го элемента матрицы в ожидаемую ценность i–й альтернативы определяется произведением величины выигрыша (проигрыша) на его вероятность. Разница состоит в том, что в классической постановке вероятность наступления j-го состояния среды одинакова для всех альтернатив, а величина ij–го выигрыша (проигрыша) специфична для каждой i–й строки. В модифицированной модели наоборот – выигрыш (проигрыш) по каждому j–му целевому показателю является постоянным, а вероятность получения этого выигрыша (проигрыша) специфична для каждой i–й альтернативы.
В представленном виде таблица решений становится удобней в использовании и получила достаточно широкое распространение. Например, таблицу можно использовать для выбора наиболее вероятного заболевания из группы болезней, имеющих сходные совокупности симптомов.
Для этого:
1. В качестве альтернатив ai рассматриваются те заболевания, при которых характерными являются наблюдаемые симптомы (гипотезы di);
2. В качестве целевых показателей Gjпринимаются сами наблюдаемые симптомы sj;
3. В качестве вероятностей pijв данном применении проставляются условные вероятности того, что при i-м заболевании наблюдается j-й симптом.
В такой постановке ЛПР исходит из того, что гипотеза di (при решении задачи диагностики заболеваний альтернативы называют гипотезами), обладающая наибольшей ожидаемой ценностью, является наиболее вероятной.
Таким образом, модель в классической постановке ориентирована на выбор альтернативы, обеспечивающей достижение наиболее благоприятных результатов в различных состояниях окружающей среды, наступление которых ЛПР контролировать не может. То есть, модель ориентирована, в основном, для целей анализа. Она позволяет выбрать оптимальный характер поведения в условиях неуправляемого наступления состояний окружающей среды. Такую стратегию выбора решений условно можно определить как «оборонительную»
А модифицированная модель ориентирована на более активный характер исследований. Она позволяет сравнивать между собой альтернативные варианты разрабатываемых конструкций, лечебных средств, организационных решений и т. д., и выбирать альтернативу, обеспечивающую выбор такой альтернативы, которая повышает вероятность достижения желательных целевых показателей и снижает вероятность наступления негативных последствий принятия того или иного решения. При этом под выбором предпочтительной альтернативы может также подразумеваться выявление (распознание) наиболее вероятной альтернативы (причины) появления некой совокупности последствий (наблюдаемых j–х признаков). Следовательно, выбор той или другой модели зависит от целей проводимого анализа.
При всей кажущейся простоте постановки применение модифицированной модели требует обязательного дополнительного рассмотрения для выбора используемых критериев оценки полезностей. Прежде всего, следует иметь в виду, что в качестве целевых показателей следует иметь в виду не только желательные результаты, достигаемые при выборе конкретной альтернативы, но и все неизбежные последствия, обусловленные этим выбором, в том числе, естественно и негативные. При этом целевые показатели (последствия) могут иметь и количественную меру.
Оба из рассмотренных классов моделей имеют достаточно серьезные ограничения в смысле адекватного отображения, как ситуации выбора, так и полноты оценки ожидаемых последствий этого выбора. Так, в классическом варианте элементами платежной матрицы являются выигрыши (проигрыши), оцениваемые единственным показателем. Этого может быть достаточно в простейших, например в игровых ситуациях, если под выбором альтернативы подразумевается выбор очередного хода, а под состоянием окружающей среды понимается ожидаемый ход противника. Тогда выигрыш в шахматах – это предпочтительность достигнутой позиции, степень которой может быть оценена количественно. Выигрыш в покере – вероятность получения (или потери) определенной суммы денег и т. п.
Но совсем иная ситуация возникает при оценке предпочтительности альтернативного организационного решения. В сколь-нибудь серьезных ситуациях любое решение влечет за собой несколько значительных последствий как позитивных, так и негативных. Конечно, ожидаемая ценность комплексного исхода может быть определена путем введения рангов полезностей для каждого из исходов и последующего суммирования. Однако адекватность такой оценки во многих случаях может оказаться недостаточной.
С этой точки зрения использование расширенной модели представляется предпочтительным. В платежной матрице в табл. предполагается оценка всех ожидаемых последствий Gjпутем введения соответствующих рангов. Этот подход является более конструктивным, особенно, если при составлении перечня ожидаемых последствий не забывают о негативных. А вероятность последнего довольно велика. В известной мере это связано с тем, что последствия в рассматриваемой таблице решений именуются целями. Естественно предположить, что оценивая вероятность достижения ряда важных целей можно выпустить из виду, что достижение любой из них может повлечь за собой реализацию нежелательных последствий.
Серьезным недостатком расширенной модели является то обстоятельство, что ожидаемая значимость (полезность) любой из намеченных целей по существу оценивается только для одного состояния окружающей среды. Причем для этого состояния нет сформулированного описания. Между тем, значимость каждой из целей может значительно изменяться при изменении состояния окружающей среды. Даже если не забыты вероятные негативные последствия, то оценки их значимости могут кардинально измениться при наступлении определенных состояний среды.
Можно представить (с огромной долей фантазии), что решение о вводе в эксплуатацию Саяно-Шушенской ГЭС принималось с помощью научных методов теории принятия решений, а не только на основе субъективного анализа краткосрочных перспектив и коньюктурных соображений. Тогда при анализе альтернативных вариантов ввода (например: ввод без проведения профилактического ремонта, проведение профилактического ремонта, проведение капитального ремонта агрегата, замена агрегата, в котором возникают нежелательные вибрации и т. п.) следовало рассмотреть негативные последствия каждой из альтернатив: отказ агрегата, серьезную аварию и наконец, срыв шпилек и выброс агрегата.
Если вероятности вклада каждой из альтернатив (даже первой из них) в продуцирование негативных последствий оценивать для лишь одного состояния среды – будничный ход событий, то эти оценки могли быть крайне низкими, не заслуживающими учета. Особенно вероятность катастрофы такого масштаба, какой имел в реальности. Но, если ввести в рассмотрение такие состояния среды, как возникновение перегрузки, усталость металла шпилек, нарушение связи с центральной диспетчерской, неадекватные действия оператора, не отключившего турбину, то оценки значимости негативных последствий неизмеримо возрастут. И тогда решение о вводе в эксплуатацию недостаточно надежного оборудования не могло бы расцениваться как низкий профессионализм и халатность, а являлись бы, по своему существу, актом промышленной диверсии.
Существует возможность объединения описанных моделей обоих классов в одну интегрированную модель, которая обладала бы достоинствами обеих моделей и, в то время, позволяла бы избавиться от недостатков, присущих каждой из них. с этой целью предлагается использовать модель с трехмерной матрицей решений, структура которой представлена на рис. 1.
Предлагаемая модель представляет ЛПР как лицо, производящее выбор из совокупности альтернативA = {a1, a2, ..., am} при условии, что заданы:
1. Набор состояний окружающей среды S = {s1, s2, ..., sk}, факт наступления которых не поддаются управлению, но вероятности их наступлений P= известны (то есть состояние s1 будет иметь место с вероятностью p1и т. д.).
2. Задана совокупность N возможных исходов G1, G2, …, Gj. При этом .
3. Задана матрица вероятностей pijтого, что выборi-й альтернативы приведет к j-му исходу. Исходы могут быть как взаимонезависимыми, так и связанными между собой определенными зависимостями. Это обстоятельство учитывается при оценке вероятностей pij . Позитивные исходы могут трактоваться как цели, для достижения которых и производится выбор наилучшей альтернативы. Негативные исходы отображают факт реализации возможных негативных последствий.
4. Задана матрица платежей в терминах затрат или выигрышей wjk, ассоциированных с каждой парой “исход - состояние окружения”.
В ситуациях, когда нет необходимости учитывать различные состояния окружающей среды, то есть, либо это состояние не оказывает существенного влияния, либо маловероятны заметные изменения этого состояния, модель, представленная на рис.3, сводится к двухмерной модифицированной матрице решений, предствленной таблицей 3.
Ценность каждой i-ой альтернативы при k-ом состоянии окружающей среды определяется соотношеним:
(1)
Лучшей альтернативой является та, которая обладает наибольшей ожидаемой ценностью.
В ситуации, когда подразумевается, что каждая из анализируемых альтернатив заведомо приводит лишь к одному из исходов, трехмерная матрица решений сводится к двухмерной матрице статистической игры, представленной таблицей 2. На рис. 1 эта матрица отображена в плоскости XZ. В качестве выбираемых альтернатив в этом случае рассматриваются ожидаемые исходы, а элементы матрицы платежей, которые в табл. 3 обозначаются vij, в матрице на рис. 1 обозначены как wjk. Наилучшей альтернативой в этой ситуации является та, выбор которой доставляет исход Gj, имеющий наибольшую ожидаемую ценность. Ожидаемая ценность каждого из исходов может быть определена из соотношения:
(2)
Таким образом, трехмерная матрица на рис. 1 представляет совокупность LN двухмерных матриц. При этом L матриц, отображаемых в плоскости XY, являются модифицированными матрицами решений, а N матриц, отображаемых в плоскости YZ , являются матрицами статистической игры.
Эта особенность трехмерной матрицы придает ей свойство универсальности, поскольку позволяет более полно прогнозировать как ожидаемый выигрыш при выборе той или иной альтернативы, так и степень тяжести сопутствующих ей негативных последствий. Например, ожидаемая ценность каждой из анализируемых альтернатив можно оценить из соотношения:
(3)
Возвращаясь к катастрофе на Саяно-Шушенской ГЭС, можно предположить, что использование подобного подхода могло бы дать убедительные оценки опасности принятия решения о вводе ее в эксплуатацию при наличии явных признаков ненормальности поведения одного из агрегатов. Даже если бы вероятности масштабной катастрофы оценивались чересчур оптимистично для стандартных условий окружающей среды, то при рассмотрении неблагоприятных условий окружающей среды эти оценки вероятностей должны были значительно возрасти. И тогда очень трудно было бы «закрыть глаза» на ожидаемые степени тяжести негативных исходов, на недопустимо высокий риск принятия этого решения.
Что касается будущих перспектив использования предлагаемого подхода, то в настоящее время отсутствует практический опыт его применения. Поэтому, о возможной эффективности модели можно говорить только гипотетически, исходя из логических рассуждений, изложенных выше.
Литература
Х. Таха Ведение в исследование операций. - М., Мир, 1985
Льюис Р., Райф Х. Игры и решения. - М..ИЛ. 1961
Коршунов Ю. М. Математические основы кибернетики, - М., Энергия,1980
Исследование операции. пер. с англ. под ред. Бескровного И. М., Макарова И. М. - М., Мир, 1981
Теория выбора и принятия решений: Учебное пособие. – М.,Наука, 1982
Питер Джексон. Введение в экспертные системы. 3-е издание
9
Библиографическая ссылка
Бескровный И. М. Трехмерная интегрированная модель принятия решений // Системный анализ и управление.
URL: http://econf.rae.ru/article/4986 (дата обращения: 22.12.2024).