Применение метода анализа данных - деревья решений

 

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

ФАКУЛЬТЕТ ЭКОНОМИКИ И МЕНЕДЖМЕНТА

Кафедра экономической кибернетики










РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА

по дисциплине:

"Математические методы принятия решений"














Симферополь, 2010

Содержание


Теоретическая часть

Преимущества использования деревьев решений

Области применения деревьев решений

Задание

Литература

Теоретическая часть


Своевременная разработка и принятие правильного решения - главные задачи работы управленческого персонала любой организации. Непродуманное решение может дорого стоить компании. На практике результат одного решения заставляет нас принимать следующее решение и т.д. Когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего решения или исходов испытаний, то применяют схему, называемую деревом решений.

Деревья решений - один из методов автоматического анализа данных, основные идеи которого восходят к работам П. Ховленда (Р. Hoveland) и Е. Ханта (Е. Hunt) конца 50-х годов XX в. Их итогом явилась основополагающая монография, давшая импульс развитию этого направления.

Построение деревьев классификации - один из наиболее важных приемов, используемых при проведении "добычи данных и разведывательного анализа" (Data Mining), реализуемый как совокупность методов аналитической обработки больших массивов информации с целью выявить в них значимые закономерности и/или систематические связи между предикторными переменными, которые затем можно применить к новым совокупностям измерений.

Дерево решений представляет из себя некий графический инструмент, который помогает производить действия, такие, как: описание возможных стратегий игрока, описание неопределенных исходов (неизвестные стратегии второй стороны) и их вероятностей, вычисление EMV по стратегиям первого игрока, выбор стратегии с максимальным значением EMV. Как правило, применение этого графического средства предполагает использование следующих соглашений:

) деревья решений состоят из вершин (круги, квадраты и треугольники) и ветвей (линии);

) вершины соответствуют определенным моментам времени. Вершины-решения (квадраты) соответствуют моментам времени, когда ЛПР (лицо принимающее решение) принимает решение. Вершины-вероятности (круги) соответствуют моментам времени, когда разрешается одна из неопределенностей. Оконечные вершины (треугольники) соответствуют окончанию задачи, когда все решения приняты, все неопределенности разрешились и все платежи произошли;

) развитие ситуации во времени происходит согласно данной графической схеме слева направо;

) ветви, идущие из вершин-решений, соответствуют различным возможным решениям. Ветви, идущие из вершин-вероятностей, соответствуют различным возможным вариантам разрешения неопределенности и не являются объектом чьего-либо управления;

) вероятности соответствуют ветвям, исходящим из вершин вероятностей. Эти вероятности являются условными вероятностями при условии свершения события, соответствующего вершине, из которой они исходят. Поэтому сумма вероятностей по всем ветвям, исходящим из одной вершины, равна 1;

) каждой оконечной вершине соответствуют два числовых значения.

Первое - это вероятность прихода в данную оконечную вершину и второе - значение платежа, соответствующее данному сценарию развития событий.


Преимущества использования деревьев решений


Рассмотрев основные проблемы, возникающие при построении деревьев, было бы несправедливо не упомянуть об их достоинствах:

·быстрый процесс обучения;

·генерация правил в областях, где эксперту трудно формализовать свои знания;

·извлечение правил на естественном языке;

·интуитивно понятная классификационная модель;

·высокая точность прогноза, сопоставимая с другими методами (статистика, нейронные сети);

·построение непараметрических моделей.

В силу этих и многих других причин, методология деревьев решений является важным инструментом в работе каждого специалиста, занимающегося анализом данных, вне зависимости от того практик он или теоретик.


Области применения деревьев решений


Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (data mining).

В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений. В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя

·Деревья решений успешно применяются для решения практических задач в следующих областях:

·Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.

·Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.

·Медицина. Диагностика различных заболеваний.

·Молекулярная биология. Анализ строения аминокислот.

дерево решение классификация управленческий

Это далеко не полный список областей где можно использовать деревья решений. Не исследованы еще многие потенциальные области применения.

На сегодняшний день существует значительное число алгоритмов, реализующих построение деревьев решений, из которых наибольшее распространение и популярность получили следующие:

·CART (Classification and Regression Tree), разработанный Л. Брейманом с соавторами [Breiman et al., 1984], представляет собой алгоритм построения бинарного дерева решений - дихотомической классификационной модели; каждый узел дерева при разбиении имеет только двух потомков; как видно из его названия, алгоритм решает задачи как классификации, так и регрессии;

·C4.5 - алгоритм построения дерева решений с неограниченным количеством потомков у узла, разработанный Р. Куинленом [Quinlan, 1993]; не умеет работать с непрерывным целевым полем, поэтому решает только задачи классификации;

·QUEST (Quick, Unbiased, Efficient Statistical Trees) - программа, разработанная В. Ло и И. Ши [Loh, Shih, 1997], в которой используются улучшенные варианты метода рекурсивного квадратичного дискриминантного анализа, позволяющие реализовать многомерное ветвление по линейным комбинациям порядковых предикторов; содержит ряд новых средств для повышения надежности и эффективности индуцируемых деревьев классификации.


Задание


Компания решает вопрос о предоставлении нового продукта на общенациональный рынок. Неопределенность заключается в том, как отреагирует рынок на новый продукт. Рассматривается вопрос об апробации нового продукта первоначально на некотором региональном рынке. Таким образом, первоначальное решение, которое необходимо принять компании - это проводить ли первоначальный маркетинг продукта на региональном уровне.

Компания предполагает, что выход на региональный уровень потребует затрат на 3 млн. грн., а выход на общенациональный рынок потребует вложения 90 млн. грн. Если не проводить первоначальных пробных продаж на региональном уровне, то решение о выходе на общенациональный рынок можно принять незамедлительно.

Компания рассматривает результаты продаж как успешные, средние или отрицательные в зависимости от объемов продаж. Для регионального уровня этим градациям соответствуют объемы в 200, 100 и 30 тыс. экземпляров, а для общенационального 6000, 3000 и 900 тыс. экземпляров соответственно. Исходя из данных по результатам региональных тестирований аналогичных видов продукции компания оценивает вероятности указанных трех исходов как 0,2, 0,5 и 0,3. Кроме того, исследуя данные о соотношении результатов региональных продаж с последующими продажами на общенациональном рынке, компания сумела оценить следующие условные вероятности (табл.).


Вариант №2Условные вероятности продаж на общенациональном рынке успешныесредниеотрицательныеВероятности продаж на региональном рынке0,2успешные0,60,20,20,5средние0,70,20,10,3отрицательные0,10,20,7

Кроме этого известно, что каждая продажа приносит прибыль в 18 грн. как при продаже на региональном рынке, так и на общенациональном.

Задача состоит в принятии обоснованной стратегии выхода (или невыхода) на рынок с новой товарной позицией.

Решение

Построим дерево решений для данной задачи (рис.1)

Приведем расчет характеристик дерева решений:


,2 * 0,6 + 0,5 * 0,7 + 0,3 * 0,1 = 0,5

,2 * 0,2 + 0,5 * 0,2 + 0,3 * 0,2 = 0,2

,2 * 0,2 + 0,5 * 0,1 + 0,3 * 0,7 = 0,3

000 * 18 = 108 000

000 * 18 = 54 000

* 18 = 16 200

000 - 90 000 = 18 000

000 - 90 000 = - 72 000

200 - 90 000 = - 73 800

,5 * 108000 + 0,2 * 54000 + 0,3 * 16200 - 90000 = - 20340

* 18 = 3 600

* 18 = 1 800

* 18 = 540

,6 * 10800 + 0,2 * 54000 + 0,2 * 16200 - 90000 + 3600 - 3000 = - 68880

600 - 3 000 = 600

000 - 90 000 + 3 600 - 3 000 = 18 600

000 - 90 000 + 3 600 - 3 000 = - 35 400

200 - 90 000 + 3 600 - 3 000 = - 73 200

,6 * 0,2 = 0,12

,2 * 0,2 =0,04

,2 * 0,2 = 0,04

,7 * 10800 + 0,2 * 54000 + 0,1 * 16200 - 90000 + 1800 - 3000 = - 71220

- 3 000 = - 1200

000 - 90 000 + 1 800 - 3 000 = 16 800

000 - 90 000 + 1 800 - 3 000 = - 37 200

200 - 90 000 + 1 800 - 3 000 = - 75 000

,1 * 10800 + 0,2 * 54000 + 0,7 * 16200 - 90000 + 540 - 3000 = - 69240

- 3 000 = - 2 460

000 - 90 000 + 540 - 3 000 = 15 540

000 - 90 000 + 540-3 000 = - 38 460

200 - 90 000 + 540-3 000 = - 76 260.


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ ФАКУЛЬТЕТ ЭКОНОМИКИ И МЕНЕДЖМЕНТА Кафедра экономической кибернетики РАСЧЕТ

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ