Модуль поддержки принятия управленческих решений на медицинском предприятии

 

Содержание


Введение

1. Теоретическая часть

1.1 Определение DSS (СППР)

1.2 Общая схема принятия решений

1.3 Классификация СППР

Классификация на уровне пользователя

Классификация по функциональному наполнению интерфейса системы

Классификация на концептуальном уровне

Классификация по архитектуре

Классификация в зависимости от вида данных, с которыми работают СППР

Классификация СППР по уровням

Классификация СППР по функциональным возможностям

Классификация СППР по уровню распределенности

1.4 Перспективы развития систем поддержки принятия решений

1.5 Аналитические методы в средствах разведки данных (DataMining)

1.6 Анализ данных в медицинских информационных системах и СППР

Выводы по разделу 1

2. Аналитическая часть

2.1 Ассоциативные правила (AssociationRules)

Численные ассоциативные правила (QuantitativeAssociationRules)

2.2 Apriori - масштабируемый алгоритм поиска ассоциативных правил

Свойство анти-монотонности

Алгоритм Apriori

2.3 FPG - альтернативный алгоритм поиска ассоциативных правил

Алгоритм Frequent Pattern-Growth Strategy (FPG)

Извлечение частых предметных наборов из FP-дерева

Выводы по разделу 3

4. Эффективность применения модуля поддержки принятия управленческих решений и полученные с его помощью результаты

4.1 Эффективность модуля ППУР

Эффективность поиска ассоциативных правил

Эффективность графиков приобретения услуг

Эффективность оценки загруженности персонала

4.2 Полученные результаты

Результаты поиска ассоциативных правил

Результаты построения графиков приобретенных услуг

Результаты оценки загруженности персонала

Выводы по разделу 4

Сноски

Введение


Актуальность темы обусловлена тем, что современные медицинские предприятия оснащены передовыми технологиями: медицинское оборудование, информационные системы управления данными, лаборатории, что порождает необходимость в автоматизированном анализе данных с помощью встроенного модуля поддержки принятия решений.

Медицинский учет, медицинская отчетность и их анализ являются последовательными и взаимно связанными звеньями. Взаимная связь этих звеньев заключается в следующем: правильно организованный медицинский учет способствует рациональной организации труда медицинского персонала для улучшения медицинского обслуживания и создает возможность последовательно накапливать данные о деятельности учреждения.

Медицинская документация представляет собой набор документов, предназначенных для записи данных о состоянии здоровья населения и отдельных лиц, отражающих характер, объем и качество оказываемой медицинской помощи, для ее организации и управления службами здравоохранения.

Система поддержки принятия решений позволяет использовать полученные данные, на основе которых помогает менеджеру в принятии решения, а также обеспечивают поддержку принимаемого решения менеджером. Важнейшей целью этих СППР является поиск наиболее рациональных вариантов развития бизнеса компании с учетом влияния различных факторов, таких как конъюнктура целевых для компании рынков, изменения финансовых рынков и рынков капиталов, изменения в законодательстве и сезонные вспышки заболеваний, посещаемость, распространенность вида заболевания, количество операций, занятость медицинского персонала и др.

По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия, в идеале адекватно отражающей в режиме реального времени основные аспекты производственной и финансовой деятельности.

СППР в медицинских информационных системах используются для помощи менеджерам и руководителям в принятии решений на основе анализа большого количества статистической информации. Например, помощь с составлением рабочего графика, выявление перспективных путей развития предприятия или предупреждение о возможной нехватке врача-специалиста, в связи с большой проходимостью пациентов или сезонными вспышками заболеваний

Предметами данного исследования являются системы автоматизированной обработки информации.

Объектом исследования является - программное обеспечение систем автоматизированной обработки информации.

Цель работы: разработать и внедрить программный модуль поддержки принятия управленческих решений для информационной системы медицинского предприятия ООО "Центр Эндохирургических Технологий".

Исходя из цели работы были поставлены следующие задачи:

-Рассмотреть существующие методы информационной поддержки принятия решения.

-Рассмотреть различные методы и алгоритмы DataMining в задачах поддержки принятия решений

-Разработать модуль поддержки принятие управленческих решений с использованием методов DataMining (метод ассоциативных правил, секвенциальный анализ, и т.д.)

-Интегрировать программный модуль поддержки принятия управленческих решений с информационной системой предприятия.

1. Теоретическая часть


Одной из возможных технологий организации подобного взаимодействия, является технология систем поддержки принятия решений (СППР). Современные системы поддержки принятия решения представляют собой системы, максимально приспособленные к решению задач повседневной управленческой деятельности, являются инструментом, призванным оказать помощь лицам, принимающим решения (ЛПР). С помощью СППР может производиться выбор решений некоторых неструктурированных и слабоструктурированных задач, в том числе и многокритериальных.


.1 Определение DSS (СППР)


Для функционирования ИС необходимо обеспечить как наличие средств генерации данных так и средства их анализа. Имеющиеся в ИС средства построения запросов и различные механизмы поиска хотя и облегчают извлечение нужной информации, но все же не способны дать достаточно интеллектуальную ее оценку, т.е. сделать обобщение, группирование, удаление избыточных данных и повысить достоверность за счет исключения ошибок и обработки нескольких независимых источников информации (не только корпоративных БД, но и внешних). Проблема эта становится чрезвычайно важной в связи с лавинообразным возрастанием объема информации и увеличением требований к инфосистемам по производительности - сегодня успех в управлении предприятием во многом определяется оперативностью принятия решений, данные для которых и предоставляет ИС.

СППР представляют собой системы, разработанные для поддержки процессов принятия решений в сложных мало структурированных ситуациях, связанных с разработкой и принятием решений. Главной особенностью информационной технологии поддержки принятия решений является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения, что является основной целью этой технологии, происходит в результате итерационного процесса, изображенного на рисунке 1, в котором участвуют:

-система поддержки принятия решений в роли вычислительного звена и объекта управления;

-человек как управляющее звено, задающее входные данные и оценивающее полученный результат вычислений на компьютере.


Рисунок 1 - Информационная технология поддержки принятия решений как итерационный процесс


Окончание итерационного процесса происходит по воле человека. В этом случае можно говорить о способности информационной системы совместно с пользователем создавать новую информацию для принятия решений.

СППР могут включать в себя ситуационные центры, средства многомерного анализа данных и прочие инструменты аналитической, позволяют моделировать правила и стратегии бизнеса и иметь интеллектуальный доступ к неструктурированной информации. Используемые на этом уровне специальные математические методы позволяют прогнозировать динамику различных показателей, анализировать затраты по разным видам деятельности, уяснять их детальную структуру, формировать подробные бюджеты по разным схемам.

До сих пор нет единого определения СППР, в качестве примера можно привести следующие:

-это наиболее мощный представитель класса аналитических систем ориентированный на:

-анализ больших массивов данных,

-на выполнение более сложных запросов,

-моделирование процессов предметной области,

-прогнозирование,

-нахождение зависимостей между данными

-для проведения анализа "что если"

-это интерактивная прикладная система, которая обеспечивает конечным пользователям, принимающим решение, легкий и удобный доступ к данным и моделям с целью принятия решений в слабоструктурированных и неструктурированных ситуациях в разных областях человеческой деятельности

-это такие системы, которые основываются на использовании моделей и процедур обработки данных и мыслей, которые помогают принимать решение

-это интерактивные автоматизированные системы, которые помогают лицам, принимающим решение, использовать данные и модели для решения неструктурированных и слабоструктурированных проблем

-это компьютерная информационная система, используемая для поддержки разных видов деятельности во время принятия решений в ситуациях, когда невозможно или нежелательно иметь автоматическую систему, полностью выполняющую весь процесс решений

-это многоуровневая многофункциональная автоматизированная система выработки и реализации решений, которая формируется на основе:

·синтеза функциональных и структурных схем отдельных звеньев объекта;

модуль поддержка принятие решение

·сквозных моделей и задач по стадиям жизненного цикла изделия и самого объекта;

·объединения разрозненных локальных подсистем в единую систему управления;

·создания взаимосвязанных контуров управления и усиления роли оперативного управления (для изучения логики и диагностики их течения);

·углубления системного и программно-целевого подхода к планированию и автоматического анализа работы объекта;

·развития единых сквозных норм и нормативов;

·создания разветвленной АРМ (как интеллектуальных терминалов), обеспечения программных взаимосвязей, согласования информации и диалога.

DSS (СППР) - это человеко-машинный вычислительный комплекс, ориентированный на анализ данных и обеспечивающий получение информации, необходимой для принятия решений в сфере управления. Такое разнообразие определений отображает широкий диапазон разных типов СППР. Но практически все виды этих компьютерных систем характеризуются четкой структурой, которая содержит три главных компонента, которые составляют основу классической структуры СППР, отличающей ее от других типов ИС:

Три компонента - основа классической структуры СППР:

·интерфейс пользователя, который дает возможность лицу, которое имеет право принимать решения, проводить диалог с системой, используя разные программы ввода, форматы и технологии вывода;

·подсистема, предназначенная для сохранения, управления, выбора, отображения и анализа данных;

подсистема, которая содержит набор моделей для обеспечения ответов на множество запросов пользователей, для аналитических задач.

1.2 Структура СППР


В состав системы поддержки принятия решений входят три главных компонента: база данных, база моделей и программная подсистема, которая состоит из трех подсистем: системы управления базой данных (СУБД), системы управления базой моделей (СУБМ) и системы управления интерфейсом между пользователем и компьютером. Структура СППР, а также функции составляющих ее блоков, определяющих основные технологические операции, представлены на рисунке.

Любая система поддержки принятия решений содержит подсистему данных, которая состоит из двух основных частей: БД и системы управления базой данных (СУБД) (Рисунок 2). БД играет в информационной технологии поддержки принятия решений важную роль. Данные могут использоваться непосредственно пользователем для расчетов при помощи математических моделей. СППР получают информацию из управленческих и операционных ИС.


Рисунок 2-Основные компоненты информационной технологии поддержки принятия решений


Источники данных и их особенности

-часть данных поступает от информационной системы операционного уровня. Эффективность их использования определяется предварительно обработкой:

-системой управления базой данных, входящую в состав системы поддержки принятия решений;

-за пределами системы поддержки принятия решений, создав для этого специальную базу данных. Этот вариант более предпочтителен для предприятий, производящих большое количество операций. Обработанные данные об операциях образуют файлы, которые для повышения надежности и быстроты доступа хранятся за пределами системы поддержки принятия решений.

-внутренние данные, например данные о движении персонала, инженерные данные и т.п., которые должны быть своевременно собраны, введены и поддержаны

-данные из внешних источников. В числе необходимых внешних данных следует указать данные о конкурентах, национальной и мировой экономике. В отличие от внутренних данных внешние данные обычно приобретаются у специализирующихся на их сборе организации.

-документы, включающих в себя записи, письма, контракты, приказы и т.п. Если содержание этих документов будет записано в памяти и затем обработано по некоторым ключевым характеристикам (поставщикам, потребителям, датам, видам услуг и др.), то система получит новый мощный источник информации.

Присущий технологии СППР акцент на обработку неструктурированных и слабоструктурированных задач предопределяет некоторые специфические требования к этим элементам компьютерной системы. Прежде всего, речь идет о необходимости выполнять значительный объем операций переструктурирования данных. Нужно предусмотреть возможность загрузки и следующей обработки данных из внешних источников; функционирования СУБД в среде СППР в отличие от обычной обработки информации в управленческих информационных системах требует более широкого набора функций. Это касается также и БД.

Вообще базу данных можно определить как совокупность элементов, организованных в соответствии с определенными правилами, которые предусматривают общие принципы описания, сохранения и манипулирования данными независимо от прикладных программ.

Связь конечных пользователей (прикладных программ) с базой данных происходит с помощью СУБД. Последняя представляет собой систему программного обеспечения, которая содержит средства обработки языками БД и обеспечивает создания БД и ее целостность, поддерживает ее в актуальном состоянии, дает возможность манипулировать данными и обрабатывать обращение к БД, которые поступают от прикладных программ и (или) конечных пользователей при условиях применяемой технологии обработки информации. В состав будто БД, которые используются для изучения и обращение к данных, належит язык описания данных (ЯОД) и язык манипулирования данными (ЯМД).

Язык описания данных предназначенный для определения структуры БД. Описание данных заданной проблемной области может выполняться на нескольких уровнях абстрагирования, причем на каждом уровне используется свое ЯОД. Описание на любом уровне называется схемой. Чаще всего используется трехуровневая система: концептуальный, логический и физический уровни. На концептуальном уровне описываются взаимосвязи между системами данных, которые отвечают реально действующим зависимостям между факторами и параметрами проблемной среды. Структура данных на концептуальном уровне называется концептуальной схемой. На логическому равные выбранные взаимосвязи отбиваются в структуре записей БД. На физическом уровне решаются вопрос организации размещения структуры записи на физических носителях информации.

Язык манипулирования данными обеспечивает доступ к данным и содержит средства для сохранения, поиска, обновления и стирания записей. Языка манипулирования данными, которые могут использоваться конечными пользователями в диалоговом режиме, часто называют языками запросов.

СУБД должна обладать следующими возможностями.

-составление комбинаций данных, получаемых из различных источников, посредством использования процедур агрегирования и фильтрации;

-быстрое прибавление или исключение того или иного источника данных;

-построение логической структуры данных в терминах пользователя;

-использование и манипулирование неофициальными данными для экспериментальной проверки рабочих альтернатив пользователя;

-обеспечение полной логической независимости этой БД от других операционных БД, функционирующих в рамках фирмы.

БД и СУБД используются в любых компьютерных системах. Тем не менее, сравнительно с обычными подходами к реализации БД для решения некоторых задач к функциям и инструментам БД и СУБД в контексте системы поддержки принятия решений выдвигается ряд дополнительных и специализированных требований.

Компьютерная система поддержки принятия решений

Опыт применения компьютеров в задачах организационного управления и принятия решений показал, что при решении конкретных проблем люди предпочитают использовать упрощенные подходы, не требующие большого разнообразия данных и изощренных моделей. В реальных ситуациях рассматриваемая проблема описывается разнохарактерной информацией, в ней сочетаются количественные и качественные факторы, наряду с объективными данными приходится учитывать субъективные суждения руководителей, знания экспертов. Однако описание проблемы почти никогда не является полным, так как бывает достаточно трудно получить всю информацию, необходимую для анализа проблемы. И, наконец, при подготовке и принятии решений необходимо учитывать особенности и пределы человеческой системы переработки информации и специальным образом подготавливать информацию, используемую людьми. Цель исследований по экспертным системам состоит в разработке программ (устройств), которые при решении задач, трудных для эксперта-человека, получают результаты, не уступающие по качеству и эффективности решениям, получаемым экспертом. В большинстве случаев экспертные системы решают трудно формализуемые задачи или задачи, не имеющие алгоритмического решения. В настоящее время экспертные системы нашли применение в разнообразных предметных областях (медицина, вычислительная техника, геология, математика, сельское хозяйство, управление, электроника, юриспруденция и др.).

Наиболее типичны для СППР многокритериальные задачи принятия решений с объективными моделями и большими массивами количественных данных. Значительно слабее освоена область задач с субъективными моделями, особенно когда в них используются качественные данные. Еще менее разработанным является применение ЭВМ на этапе предварительного анализа и структуризации рассматриваемой проблемы - одного из принципиально важных этапов подготовки и принятия решения. Основные трудности связаны здесь, во-первых, с тем, что анализ проблемы представляет собой творческий процесс, плохо поддающийся формализации. Во-вторых, пока еще крайне недостаточен арсенал средств, которые могли бы использоваться при структуризации проблемы.

Степень структуризации проблемы - центральный момент для СППР. Если проблема может быть полностью структурирована и окажется возможным составить алгоритм ее решения, который удовлетворит пользователя, то поддержка решения не нужна, так как этот алгоритм может заменить человека. В случае если проблема не имеет структуры, и нет никаких требований к данным, то поддержка решения невозможна, поскольку трудно определить стадии решения проблемы. Между этими двумя полюсами лежит область применения СППР. Наибольший эффект СППР могут дать при решении проблем, обладающих структурой, достаточной для использования объективных моделей и применения вычислений, но где в то же время существенными являются суждения и предпочтения человека. К подобным проблемам можно отнести и лазерные процессы обработки материалов, которые наряду с другими современными технологиями базируются как на разнообразных теоретических моделях, так и на многочисленных экспериментальных данных и практическом опыте работы квалифицированных специалистов-технологов.

Информационная технология поддержки принятия решений

Главной особенностью информационной технологии поддержки принятия решений является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения, что является основной целью этой технологии, происходит в результате итерационного процесса, в котором участвуют:

-система поддержки принятия решений в роли вычислительного звена и объекта управления;

-человек как управляющее звено, задающее входные данные и оценивающее полученный результат вычислений на компьютере.

Окончание итерационного процесса происходит по воле человека. В этом случае можно говорить о способности информационной системы совместно с пользователем создавать новую информацию для принятия решений.

Дополнительно к этой особенности информационной технологии поддержки принятия решений можно указать еще ряд ее отличительных характеристик:

-ориентация на решение плохо структурированных задач;

-сочетание традиционных методов доступа и обработки компьютерных данных с возможностями математических моделей и методами решения задач на их основе;

-направленность на непрофессионального пользователя;

-высокая адаптивность, обеспечивающая возможность приспосабливаться к особенностям имеющегося технического и программного обеспечения, а также требованиям пользователя.

Информационная технология поддержки принятия решений может использоваться на любом уровне управления. Кроме того, решения, принимаемые на различных уровнях управления, часто должны координироваться. Поэтому важной функцией и систем, и технологий является координация лиц, принимающих решения, как на разных уровнях управления, так и на одном уровне.

В отличие от традиционных технологий есть несколько важных моментов, которые учитываются при создании СППР.

Первый, самый важный момент заключается в том, что информация, которая нужна для принятия решений - это не просто факты, которые надо выдавать человеку, принимающему решения, а факты, интерпретированные по цели деятельности этого человека. То есть один и тот же факт, разный для людей, имеющих разную целевую деятельность, интерпретируется по-разному. Поэтому в рассматриваемой системе все факты должны интерпретироваться по сферам деятельности.

Второй важный момент состоит в том, что в современных условиях эффективное управление представляет собой ценный ресурс организации, наряду с финансовыми, материальными, человеческими и другими ресурсами. Следовательно, повышение эффективности управленческой деятельности становится одним из направлений совершенствования деятельности предприятия в целом.

Трудности, возникающие при решении задачи автоматизированной поддержки управленческого труда, связаны с его спецификой. Управленческий труд отличается сложностью и многообразием, наличием большого числа форм и видов, многосторонними связями с различными явлениями и процессами. Это, прежде всего, труд творческий и интеллектуальный. На первый взгляд, большая его часть вообще не поддается какой-либо формализации. Поэтому автоматизация управленческой деятельности изначально связывалась только с автоматизацией некоторых вспомогательных, рутинных операций. Но современное состояние информационных компьютерных технологий, совершенствование технической платформы и появление принципиально новых классов программных продуктов привело в наши дни к изменению подходов к автоматизации управления производством.

При создании СППР учитывается ряд принципов:

.Машина должна вычислять, рассчитывать варианты, а человек принимать решение.

2.Принцип Шоу: система должна быть такой, чтобы с ней мог работать даже неподготовленный пользователь.

.Принцип "бюрократичности". Этот принцип связан с уменьшением потока информации, который должен доставляться человеку для принятия решения.

.Принцип объектно-ориентированного моделирования при построении картины предметной области.

.Принцип динамической структуры.

.Принцип полноты информационного пространства.

.Принцип интеграции информационного пространства.

.Принцип децентрализации информационного хранилища.

.И, наконец, принцип компонентной сборки прикладных режимов.

Поскольку принципы противоречивы, нужно искать компромисс между каждым из этих принципов.

1.3 Общая схема принятия решений


Общая схема процесса принятия решения включает следующие этапы:

Предварительный анализ проблемы

На этом этапе определяются:

-главные цели;

-уровни рассмотрения, элементы и структура процесса;

-подсистемы и используемые ими основные ресурсы, критерии качества функционирования подсистем;

-основные противоречия, узкие места и ограничения.

Основная задача этого этапа заключается в определении целей, которых необходимо достичь в процессе управления. Непосредственное участие в процессе формирования этих целей должен принимать руководитель. Цели должны быть конкретными и выражаться измеримыми значениями, тем самым задаются показатели, которые будут впоследствии использоваться для выбора варианта управленческого решения и контроля реализации управляющих воздействий.

Под воздействием внутренних или внешних факторов или при получении дополнительной информации цели могут изменяться во времени. Таким образом, при формулировке целей управления важно учитывать как факторы взаимодействия (внутренние и внешние), так и временной аспект.

Для того, чтобы определить уровни рассмотрения, элементы и структуру процесса может быть использован, в частности, подход, предусматривающий декомпозицию главной цели до того уровня детализации, когда для нижнего уровня иерархии целей можно сформулировать критерии, позволяющие адекватно описать степень достижения целей при принятии той или иной альтернативы (Рис.3.1).

Например, главная цель фирмы ? выбор варианта внедрения СППР с целью повышения рентабельности фирмы.


Рис. 3.1 Декомпозиция целей


Критериями оценки вариантов могут выступать, например, затраты на внедрение, способность поддерживать решения, возможность адаптации к другим видам деятельности фирмы, возможность защиты информации, время реакции на запрос, надежность оборудования и пр. Наборы значений этих критериев используются для описания исходов альтернативных вариантов решений (в дальнейшем, "альтернатив"). Для решения таких сложных проблем следует привлекать многих специалистов в разных областях знаний, что при использовании такого подхода весьма затруднительно.

Цели управления должны учитывать всю накопленную объективную и субъективную информацию, а также согласовываться с имеющимися возможностями и ресурсами. В качестве технологий на этом этапе могут использоваться методики SWOT-анализа (strength sand weaknesses, opportunities and threats ? достоинства и недостатки, возможности и угрозы), сегментного анализа и т.д.

В случае если поставленные цели не согласуются с имеющимися ресурсами и возможностями, они могут оказаться недостижимыми. Это может выявиться на последующих этапах процесса поддержки принятия решения, что приведет к возврату на первый этап и уточнению и корректировке ранее поставленных целей и показателей.

Постановка задачи

Постановка конкретной задачи принятия решений (ЗПР) включает:

-формулировку задачи;

-определение типа задачи;

-выбор метода решения ЗПР;

-определение множества альтернатив и основных критериев для выбора из них наилучшей, согласование критериев.


.3 Классификация СППР


Компьютерная поддержка процесса принятия решений основана на формализации методов получения исходных и промежуточных оценок, даваемых ЛПР, и алгоритмизации самого процесса выработки решения и представляет собой итеративный процесс взаимодействия управленца и компьютера.

Программно компоненты структуры СППР в зависимости от сложности поставленных задач реализованы по-разному, поэтому на рынке программных продуктов предлагаются различные СППР. Все эти СППР можно классифицировать по различным признакам.


Классификация на уровне пользователя

На уровне пользователя Haettenschwiler (1999) делит СППР на:

Пассивной СППР называется система, которая помогает ЛПР в принятии решения, но не может вынести предложение, какое решение принять.

Активная СППР может сделать предложение, какое решение следует выбрать.

Кооперативная СППР позволяет ЛПР изменять, пополнять или улучшать решения, предлагаемые системой, посылая затем эти изменения в систему для проверки. Система изменяет, пополняет или улучшает эти решения и посылает их опять пользователю. Процесс продолжается до получения согласованного решения.


Классификация по функциональному наполнению интерфейса системы

В зависимости от функционального наполнения интерфейса системы выделяют два основных типа СППР: EIS и DSS.(ExecutionInformationSystem) ? информационные системы руководства предприятия. Эти системы ориентированы на неподготовленных пользователей, имеют упрощенный интерфейс, базовый набор предлагаемых возможностей, фиксированные формы представления информации. EIS-системы рисуют общую наглядную картину текущего состояния бизнес-показателей работы компании и тенденции их развития, с возможностью углубления рассматриваемой информации до уровня крупных объектов компании. Реальная отдача EIS-системы та, которую видит руководство компании от внедрения технологий СППР.

Для ИСР характерны следующие основные черты:

отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;

ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т.п.;

как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.(DesicionSupportSystem) ? полнофункциональные системы анализа и исследования данных, рассчитанные на подготовленных пользователей, имеющих знания как в части предметной области исследования, так и в части компьютерной грамотности.

Технологии этого типа строятся на принципах многомерного представления и анализа данных OLAP.

Такое деление систем на два типа не означает, что построение СППР всегда предполагает реализацию только одного из этих типов. EIS и DSS могут функционировать параллельно, разделяя общие данные и/или сервисы, предоставляя свою функциональность как высшему руководству, так и специалистам аналитических отделов компаний.


Классификация на концептуальном уровне

На концептуальном уровне Power (2003) различает следующие СППР, управляемые:

сообщениями (Communication-Driven DSS);

данными (Data-Driven DSS);

документами (Document-Driven DSS);

знаниями (Knowledge-Driven DSS);

моделями (Model-Driven DSS).

СППР, управляемые моделями, характеризуются в основном доступ и манипуляции с математическими моделями.

Управляемая сообщениями СППР (Communication-Driven DSS) (ранее групповая СППР - GDSS) поддерживает группу пользователей, работающих над выполнением общей задачи.

СППР, управляемые данными (Data-Driven DSS) или СППР, ориентированные на работу с данными (Data-oriented DSS), в основном ориентируются на доступ и манипуляции с данными.

СППР, управляемые документами (Document-Driven DSS), управляют, осуществляют поиск и манипулируют неструктурированной информацией, заданной в различных форматах.

Наконец, СППР, управляемые знаниями (Knowledge-Driven DSS), обеспечивают решение задач в виде фактов, правил, процедур.

На техническом уровне Power (1997) различает СППР всего предприятия и настольную.

СППР всего предприятия подключена к большим хранилищам информации и обслуживает многих менеджеров предприятия.

Настольная СППР - это малая система, обслуживающая лишь один компьютер пользователя.


Классификация по архитектуре

На сегодняшний день можно выделить четыре наиболее популярных типа архитектур СППР:

Функциональная СППР.

Независимые витрины данных.

Двухуровневое хранилище данных.

Трехуровневое хранилище данных.


Классификация в зависимости от вида данных, с которыми работают СППР

В зависимости от вида данных, с которыми эти системы работают, СППР условно можно разделить на:

Оперативные СППР предназначены для немедленного реагирования на изменения текущей ситуации в управлении финансово-хозяйственными процессами компании. СППР этого типа получили название Информационных Систем Руководства (Executive Information Systems, ИСР).

Для ИСР характерны следующие основные черты:

отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;

ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т.п.;

как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.

Стратегические СППР ориентированы на анализ значительных объемов разнородной информации, поиск наиболее рациональных вариантов развития бизнеса компании с учетом влияния различных факторов, предполагают глубокую проработку данных. Неотъемлемым компонентом СППР этого уровня являются правила принятия решений, которые на основе агрегированных данных дают возможность менеджерам компании обосновывать свои решения, использовать факторы устойчивого роста бизнеса компании и снижать риски. Технологии этого типа строятся на принципах многомерного представления и анализа данных (OLAP <#"center">Классификация СППР по уровням

Системы начального уровня. Системы начального уровня широко распространены среди предприятий небольшого размера, которые успешно используют их в своей повседневной деятельности. Отличительной чертой таких информационных систем является ограниченный охват бизнес-процессов предприятия.

Программные продукты данного класса могут сильно отличаться друг от друга по целевому назначению: сюда можно отнести как бухгалтерские, так и складские и торговые системы. Но, тем не менее, эти системы имеют много общих черт:

невысокая требовательность к выделяемым ресурсам. Системы данного класса могут работать под управлением современных промышленных СУБД, однако могут эксплуатироваться и на небольших предприятиях. Количество возможных пользователей такой системы колеблется от 1 до нескольких десятков.

подразумевается, что пользователь может приобрести, установить и начать эксплуатацию самостоятельно, однако разработчики стараются делать программы с как можно более широкими возможностями, что позволяет интегрировать такие системы с другими системами этого и более высокого классов.

Системы среднего уровня. Появление систем среднего уровня обусловлено потребностью в программном продукте с более широкими возможностями, нежели системы начального уровня. Таким образом, некоторые производители на основе современных способов и средств разработки создали готовые решения для довольно широкого круга потребностей предприятия. В состав таких систем обычно входят следующие подсистемы:

-бухгалтерский учет;

-управление производством;

-материально-техническое снабжение и сбыт;

-планирование;

-производство.

Несмотря на способность таких систем вести учет практически по всем направлениям деятельности предприятия, некоторые подсистемы реализованы в них в весьма усеченном виде. Тем не менее, количество различных параметров настройки у такой системы достигает значительного числа, что приводит потребителя к неспособности самостоятельно установить продукт. Зачастую, большую часть стоимости программного продукта среднего уровня составляют услуги по установке и настройке системы, сервисное обслуживание. Дороговизна таких систем делает их недоступными для небольших фирм.

Немаловажным минусом подобной системы является то, что успех внедрения системы среднего уровня во многом зависит от качества выполнения анализа деятельности предприятия.

Системы высшего класса. Современные версии систем высшего уровня обеспечивают планирование и управление всеми ресурсами организации. Количество различных параметров настроек достигает десятков тысяч. Однако одновременно возрастает и стоимость внедрения подобной системы.

Следует также учитывать следующий набор минусов, возникающих при введении в строй подобной системы:

-может потребоваться привлечение внешних консультантов, что приведет к значительному росту затрат;

-внедрение сложной системы зачастую требует некоторой реорганизации деятельности;

-необходимо наличие специального подразделения, которое бы перенастраивало систему под требования бизнеса.

С другой стороны, руководители организации и её персонал получают великолепный инструмент, позволяющий планировать и управлять производством.


Классификация СППР по функциональным возможностям

В последнее время в России отмечается устойчивый интерес к компьютерным интегрированным системам, способным обеспечить эффективное управление предприятием.

К концу 80-х годов идея создания единой модели данных в рамках целого предприятия заинтересовала ряд международных промышленных компаний, которые искали способ упростить управление производственными процессами. Первым шагом в данном направлении стала разработка концепции MRP (Materials Resource Planning ? планирование материальных ресурсов), рассматривавшей планирование материалов для производства. В ходе разработки концепции MRP американскими специалистами в области управления было замечено, что существует два типа материалов: с зависимым спросом (для выпуска десяти автомобилей нужно пятьдесят колес ? не больше и не меньше и при этом к определенному сроку) и с независимым спросом (типичная ситуация с запасами для торговых предприятий).

Основная цель концепции MRP заключалась в минимизации издержек, связанных со складскими запасами (в том числе и на различных участках производства). В основе этой концепции лежит понятие ВОМ (Bill Of Material - спецификация изделия, ответственность за которую возложена на конструкторский отдел), отражающее зависимость спроса на сырье, полуфабрикаты и другие продукты от плана выпуска готовой продукции. При этом очень важную роль играет время, для учета которого необходимо иметь четкое представление о технологической цепочке выпуска продукции, то есть знать, какова последовательность и длительность операций. На основании плана выпуска продукции, ВОМ и технологической цепочки осуществляется расчет потребности в материалах к конкретным срокам.

Однако у концепции MRP есть серьезный недостаток. Дело в том, что при расчете в рамках этой концепции потребности в материалах не учитываются ни имеющиеся производственные мощности, ни их загрузка, ни стоимость рабочей силы. Этот недостаток был исправлен в концепции MRPII (Manufacturing Resource Planning ? планирование производственных ресурсов). MRPII позволяла учитывать и планировать все производственные ресурсы предприятия ? сырье, материалы, оборудование, персонал и т.д.

По мере развития концепции MRPII к ней постепенно добавлялись возможности учета остальных затрат предприятия. Так появилась концепция ERP (Enterprise Resource Planning ? планирование ресурсов предприятия), называемая иногда также планированием ресурсов в масштабе предприятия (Enterprise-wide Resource Planning). В основе ERP лежит принцип создания единого хранилища данных (репозитария), содержащего всю деловую информацию, накопленную организацией в процессе ведения бизнеса, в частности финансовую информацию, данные, связанные с производством, управлением персоналом, и любые другие данные. Наличие репозитария избавляет от необходимости передавать данные от приложения к приложению. Кроме того, любая часть информации, которой располагает данная организация, становится одновременно доступной для всех работников, обладающих соответствующими полномочиями.

Концепция ERP нашла широкое применение, поскольку планирование ресурсов позволяло сократить время выпуска продукции, снизить уровень товарно-материальных запасов, а также улучшить обратную связь с потребителем при одновременном сокращении административного аппарата. Стандарт ERP позволил объединить все ресурсы предприятия и повысить эффективность управления ими.

В настоящее время практически все современные западные системы управления производством базируются на концепции ERP и отвечают ее рекомендациям. Эти рекомендации вырабатываются американской общественной организацией APICS, объединяющей производителей, консультантов в области управления производством, а также разработчиков ПО.

Самый новый из стандартов систем управления предприятиями ? CSRP (Customer Synchronized Resource Planning) ? помимо всего прочего охватывает и взаимодействие с клиентами, оформление нарядов/заказов и технических заданий, поддержка заказчика на местах и т.д. Таким образом, если стандарты MRP, MRPII и ERP ориентированы на внутреннюю организацию предприятия, то стандарт CSRP включает в себя полный цикл ? от проектирования будущего изделия, с учетом требований заказчика, до гарантийного и сервисного обслуживания после продажи. Суть концепции CSRP главным образом состоит в том, чтобы интегрировать заказчика (клиента, покупателя) в систему управления предприятием. Согласно данной концепции не отдел сбыта, а непосредственно сам покупатель размещает заказ на изготовление продукции, сам отвечает за правильность его исполнения и при необходимости отслеживает соблюдение сроков производства и поставки. При этом само предприятие может очень четко отслеживать тенденции спроса на его продукцию.


Классификация СППР по уровню распределенности

Сосредоточенные СППР. Сосредоточенные СППР включают в себя одну экспертную систему, установленную на одной вычислительной машине, помогая одному ЛПР (или небольшой группе специалистов) оценивать обстановку и принимать решения.

Типы сосредоточенных СППР:

Система, состоящая из одного узла и принимающая решения в автоматическом режиме. Такая система включает в себя ЭВМ, систему автоматического и/или ручного ввода информации и средства представления решения (возможно стандартное устройство вывода). Примером такой системы может быть система тушения пожара на каком-нибудь особо опасном объекте.

СППР, в которой решение принимает специалист, работая с системой в интерактивном режиме. Система может включать в себя экспертные системы, моделирующие программы, средства оценки принятых решений и т.д. Такой системой может быть система поддержки принятия решений при управлении подвижным объектом, когда пилоту или командиру корабля предлагаются варианты решений, и он реализует один из вариантов.

Распределенные СППР. Распределенные вычислительные системы могут быть распределены пространственно и/или функционально. Пространственно и функционально распределенные СППР состоят из локальных СППР, расположенных в связанных между собой узлах вычислительной сети, каждый из которых может независимо решать свои частные задачи, но для решения общей проблемы ни одна из них не обладает достаточными знаниями, информацией и ресурсами (или некоторыми из этих составляющих). Общую проблему они могут решать только сообща, объединяя свои локальные возможности и согласовывая принятые частные решения. Функционально распределенные системы состоят из нескольких экспертных систем (или СППР), связанных между собой информационно.

Распределенные системы получили в настоящее время все более широкое распространение по следующим причинам:

Бурное развитие технологии производства вычислительной техники позволяет объединить большое число достаточно мощных и относительно недорогих ПК в единую сеть, способную выполнять асинхронные параллельные вычисления и эффективно обмениваться информацией.

Необходимо отметить, что стратегия развития вычислительной техники 90-х годов ориентирована в основном на сетевые вычислительные структуры, в которых задачи решаются не централизовано, а распределено.

Многие предметные области, в которых используются СППР, распределены по своей природе. Некоторые из них распределены функционально (как, например, многие системы медицинской диагностики), другие распределены как пространственно, так и функционально (как, например, системы автоматизации проектирования сложных технических объектов).

Пространственно и функционально распределенные системы облегчают обмен информацией и принятие согласованных решений группами специалистов, совместно работающих над решением одной задачи, и/или группами экспертных систем, управляющих сложным техническим объектом.

Наконец, принцип модульного построения и использованиям систем также хорошо реализуется в распределенных системах поддержки принятия решений. Возможность создавать системы для: решения сложных проблем из относительно простых и автономных программно-аппаратных модулей позволяет их легче создавать, отлаживать и эксплуатировать.

Таким образом, распределенный подход поддержки принятия решений целесообразно использовать либо когда лица, принимающие решения, пространственно распределены, либо когда процесс принятия решений связан с высокой степенью функциональной специализации и, конечно, когда имеют место оба эти случая.


.4 Перспективы развития систем поддержки принятия решений


СППР, для расширения области их применения, в ближайшем будущем должны развиваться гармонически, сочетая нормативный подход с технологиями экспертных систем, акцентируя внимание на понимание способов выработки решения специалистами, используя знания экспертов, осуществить переход от обработки данных к технологии знаний [8].

Теоретической основой СППР становится сочетание нормативных методов, искусственного интеллекта и теории систем.

Как правило, СППР используют информацию из баз данных и знаний или /и предоставленную ЛПР. Известно, что руководители пользуются и информацией из текстуальных документов, отчетов, специальных обзоров, статей и др.

Можно прогнозировать более широкое применение неструктурированной информации в СППР.

Будучи расширением (и одновременно концептуальным скачком) автоматизированных рабочих мест, СППР ориентированы на отдельные проблемы принятия решений и основываются в основном на индивидуальной работе. Руководители высокого ранга используют оперативную информацию, мнения, знания руководителей своих филиалов, размещенных в других местностях, для выработки "хорошего" решения для всей управляемой системы.

СППР должны будут включать перечисленные возможности, тем более, что техническая база, компьютерные сети и распределенные базы данных уже имеются и используются в большинстве организаций.

Можно говорить о ближайших ориентирах СППР:

адаптивные системы;

системы управления распределенными процессами и ресурсами;

системы формирования и синхронизации графиков деятельности, взаимодействующих во времени и размещенных в различных местах процессов и производств;

системы, основанные как на структурированной в базах данных и знаний информации, так и на неструктурированной информации.

Процесс принятия решения начинается обычно при появлении проблемной ситуации, когда проектируется новая система (процесс), или когда отклонение от штатного режима функционирования системы (процесса) не вписывается в допустимые пределы, или это отклонение прогнозируемо в плановый период по сигналам системы.

В последнее время развивается идея принятия решений на основе слабых сигналов, когда есть лишь отдельные факты, не вписывающиеся в принятую парадигму, но еще не представляющие существенное отклонение, по которым должны быть приняты меры. Слабые сигналы говорят о возможностях, которые еще недостаточно ясны, или о предполагаемых опасностях в будущем.

В нашем динамичном мире, когда не все последствия могут быть прогнозируемы, руководителю необходимо предоставить инструмент, который если и не сумеет предложить конкретный вариант действий, то хотя бы поможет в анализе и прояснении ситуации на основе слабых сигналов. СППР смогут стать эффективными и признанными партнерами руководителей, только если обеспечат помощь в решении все более усложняющихся задач.

Производство, чтобы быть конкурентоспособным, должно основываться на новейших достижениях и в связи с этим достаточно легко переориентироваться на более совершенные технологии. Поэтому руководителю любого ранга следует обеспечить необходимую помощь в выработке и обосновании решений, адекватных изменяющимся условиям, в которых функционирует управляемая им система, и воздействиям со стороны среды. СППР являются мощным инструментом для выработки альтернативных вариантов действий, анализа последствий их применения и совершенствования навыков руководителя в столь важной области его деятельности как принятие решений.


.5 Аналитические методы в средствах разведки данных (DataMining)


Сегодня мы являемся свидетелями активного развития технологий интеллектуального анализа данных (ИАД или datamining), появление которой связано, в первую очередь, с необходимостью аналитической обработки сверхбольших объемов информации, накапливаемой в современных хранилищах данных. [13] Возможность использования хорошо известных методов математической статистики и машинного обучения для решения задач подобного рода открыло новые возможности перед аналитиками, исследователями, а также теми, кто принимает решения - менеджерами и руководителями компаний. Сложность и разнообразие методов ИАД требуют создания специализированных средств конечного пользователя для решения типовых задач анализа информации в конкретных областях. Поскольку эти средства используются в составе сложных многофункциональных систем поддержки принятия решений, они должны легко интегрироваться в подобные системы. Одним из наиболее важных и перспективных направлений применения ИАД являются бизнес-приложения, поэтому опыт канадско-американской фирмы Cognos по реализации методов ИАД в составе интегрированных интеллектуальных систем поддержки принятия решений представляет интерес как для разработчиков, так и для пользователей.

Системы ИАД применяются в научных исследованиях и образовании, в работе правоохранительных органов, производстве, здравоохранении и многих других областях. Особенно широко технология ИАД используется в деловых приложениях. В таблице 1 приведено несколько примеров приложений в области финансов и маркетингового анализа.

Аналитические методы дают конечному пользователю возможность осуществить весь цикл работы с исходными данными, имеющими большие объемы и невыясненную статистическую структуру. Этот цикл называется разведкой данных (DataMining) и состоит из нескольких этапов: выборка, исследование, модификация, моделирование, оценка результатов (Sample, Explore, Modify, Model, Assess).

Средства DataMining дают возможность ставить и решать как традиционные, так и нетрадиционные задачи анализа. Например, традиционной является постановка задачи: "Определить, имеется ли статистическая связь между такими показателями, как объем производства товара и объем его реализации (продажи)".

Нетрадиционной же была бы следующая постановка задачи: "Имеется несколько десятков (или даже сотен) показателей деятельности предприятия, и необходимо определить, между какими из них следует искать статистические связи вообще, какого рода связи следует искать (считать ли показатели равноправными, или считать одни показатели независимыми, а другие зависимыми переменными), на каких объектах эти связи проявляются".

При работе приложения на этапе выборки происходит формирование подмножества наблюдений из исходных данных (отбор по критериям или случайный отбор). На этапах исследования и модификации могут быть осуществлены: фильтрация данных, отбрасывание данных с большими выбросами, преобразование исходных переменных. На этапе моделирования осуществляется построение регрессий и оптимизация подмножества переменных, принятие решений на основе методик нейронных сетей, реализующих различные алгоритмы обучения классификации объектов, построение классификационных деревьев для отбора оптимального набора переменных и оптимального разбиения множества объектов, кластеризация и оптимальная группировка объектов. Наконец, на этапе обзора и оценки результатов пользователь имеет возможность сопоставить различные результаты моделирования, выбрать оптимальные класс и параметры моделей, представить результаты анализа в удобной форме.

На этапе подготовки данных обеспечивается доступ к любым реляционным базам данных, текстовым и SAS-файлам. Дополнительные средства преобразования и очистки данных позволяют изменять вид представления, проводить нормализацию значений, выявлять неопределенные или отсутствующие значения. На основе подготовленных данных специальные процедуры автоматически строят различные модели для дальнейшего прогнозирования, классификации новых ситуаций, выявления аналогий. Данные приложения поддерживают построение пяти различных типов моделей - нейронные сети, классификационные и регрессионные деревья решений, ближайшие k-окрестности, байесовское обучение и кластеризацию.


1.6 Анализ данных в медицинских информационных системах и СППР


Актуальность темы обусловлена тем, что современные медицинские предприятия оснащены передовыми технологиями: медицинское оборудование, информационные системы управления данными, лаборатории, что порождает необходимость в автоматизированном анализе данных.

Анализ данных в значительной степени необходим для работников медицинского учреждения и его руководителя в первую очередь. Годовой медицинский статистический отчет представляет сводку данных об объемах и характере работы учреждения, условиях, в которых протекала за отчетный период деятельность учреждения. Анализ этих данных помогает вскрывать причины отрицательных показателей работы учреждения в целом или его отдельных структурных подразделений. В то же время, являясь как бы летописью учреждения, последовательно из года в год, составляемый годовой отчет содержит сведения, необходимые для всякого рода справок, докладов и т.д.

Медицинский учет, медицинская отчетность и их анализ являются последовательными и взаимно связанными звеньями. Взаимная связь этих звеньев заключается в следующем: правильно организованный медицинский учет способствует рациональной организации труда медицинского персонала для улучшения медицинского обслуживания и создает возможность последовательно накапливать данные о деятельности учреждения.

Медицинская отчетность представляет собой государственную общеобязательную программу обобщения сведений, накопленных в процессе ведения медицинского учета. Без правильно организованного учета невозможно составление достоверных сведений государственной медицинской статистической отчетности. Анализ данных учета и отчетности позволяет изучить деятельность организации на основе данных медицинского учета, выявить достижения и недочеты в работе и понять их причины.

Медицинская документация представляет собой набор документов, предназначенных для записи данных о состоянии здоровья населения и отдельных лиц, отражающих характер, объем и качество оказываемой медицинской помощи, для ее организации и управления службами здравоохранения.

Система поддержки принятия решений позволяет использовать полученные данные, на основе которых помогает менеджеру в принятии решения, а также обеспечивают поддержку принимаемого решения менеджером. Важнейшей целью этих СППР является поиск наиболее рациональных вариантов развития бизнеса компании с учетом влияния различных факторов, таких как конъюнктура целевых для компании рынков, изменения финансовых рынков и рынков капиталов, изменения в законодательстве и сезонные вспышки заболеваний, посещаемость, распространенность вида заболевания, количество операций, занятость медицинского персонала и др. По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия, в идеале адекватно отражающей в режиме реального времени основные аспекты производственной и финансовой деятельности.

СППР в медицинских информационных системах используются для помощи менеджерам и руководителям в принятии решений на основе анализа большого количества статистической информации. Например, помощь с составлением рабочего графика, выявление перспективных путей развития предприятия или предупреждение о возможной нехватке врача-специалиста, в связи с большой проходимостью пациентов или сезонными вспышками заболеваний.


Выводы по разделу 1


Рассмотрение экспертных систем, представляющие собой самодостаточную среду для разработки, внедрения и сопровождения приложений в широком диапазоне отраслей. Они объединяют в себе как универсальные технологии построения современных информационных систем (стандарты открытых систем, архитектура клиент/сервер, объектно-ориентированное программирование, использование ОС, обеспечивающих параллельное выполнение в реальном времени многих независимых процессов), так и специализированные методы (рассуждения, основанные на правилах, рассуждения, основанные на динамических моделях, или имитационное моделирование, процедурные рассуждения, активная объектная графика, структурированный естественный язык для представления базы знаний), а также интегрирует технологии систем, основанных на знаниях с технологией традиционного программирования (с пакетами программ, с СУБД, с контроллерами и концентраторами данных и т.д.).

Все это позволяет с помощью данной оболочки создавать практически любые большие приложения значительно быстрее, чем с использованием традиционных методов программирования, и снизить трудозатраты на сопровождение готовых приложений и их перенос на другие платформы.

В нашем динамичном мире, когда не все последствия могут быть прогнозируемы и не все пути решений можно увидеть, руководителю необходимо предоставить инструмент, который если и не сумеет предложить конкретный вариант действий, то хотя бы поможет в анализе и прояснении ситуации на основе слабых сигналов. СППР смогут стать эффективными и признанными партнерами руководителей, только если обеспечат помощь в решении все более усложняющихся задач. Для этого потребуется использование элементов искусственного интеллекта, как например, в автоматизированных системах принятия решений и системах с использованием интеллектуального анализа данных.

Производство, чтобы быть конкурентоспособным, должно основываться на новейших достижениях и в связи с этим достаточно легко переориентироваться на более совершенные технологии. Поэтому руководителю любого ранга следует обеспечить необходимую помощь в выработке и обосновании решений, адекватных изменяющимся условиям, в которых функционирует управляемая им система, и воздействиям со стороны среды. СППР являются мощным инструментом для выработки альтернативных вариантов действий, анализа последствий их применения и совершенствования навыков руководителя в столь важной области его деятельности как принятие решений.

2. Аналитическая часть


2.1 Ассоциативные правила (AssociationRules)


В последнее время неуклонно растет интерес к методам "обнаружения знаний в базах данных" (knowledge discovery in databases <#"12" src="doc_zip4.jpg" />I. Каждая транзакция представляет собой бинарный вектор, где t [k] =1, если ik элемент присутствует в транзакции, иначе t [k] =0. Мы говорим, что транзакция T содержит X, некоторый набор элементов из I, если XT. Ассоциативным правилом называется импликация XY, где XI, YI и XY=. Правило XY имеет поддержку s (support), если s% транзакций из D, содержат XY, supp (XY) = supp (XY). Достоверность правила показывает какова вероятность того, что из X следует Y. Правило XY справедливо с достоверностью (confidence) c, если c% транзакций из D, содержащих X, также содержат Y, conf (XY) = supp (XY) /supp (X).

Другими словами, целью анализа является установление следующих зависимостей: если в транзакции встретился некоторый набор элементов X, то на основании этого можно сделать вывод о том, что другой набор элементов Y также же должен появиться в этой транзакции. Установление таких зависимостей дает нам возможность находить очень простые и интуитивно понятные правила.

Алгоритмы поиска ассоциативных правил предназначены для нахождения всех правил X Y, причем поддержка и достоверность этих правил должны быть выше некоторых наперед определенных порогов, называемых соответственно минимальной поддержкой (minsupport) и минимальной достоверностью (minconfidence).

Задача нахождения ассоциативных правил разбивается на две подзадачи:

1.Нахождение всех наборов элементов, которые удовлетворяют порогу minsupport. Такие наборы элементов называются часто встречающимися.

2.Генерация правил из наборов элементов, найденных согласно п.1. с достоверностью, удовлетворяющей порогу minconfidence.

Один из первых алгоритмов, эффективно решающих подобный класс задач, - это алгоритм APriori [2]. Кроме этого алгоритма в последнее время был разработан ряд других алгоритмов: DHP [5], Partition [6], DIC [7] и другие.

Значения для параметров минимальная поддержка и минимальная достоверность выбираются таким образом, чтобы ограничить количество найденных правил. Если поддержка имеет большое значение, то алгоритмы будут находить правила, хорошо известные аналитикам или настолько очевидные, что нет никакого смысла проводить такой анализ. С другой стороны, низкое значение поддержки ведет к генерации огромного количества правил, что, конечно, требует существенных вычислительных ресурсов. Тем не менее, большинство интересных правил находится именно при низком значении порога поддержки. Хотя слишком низкое значение поддержки ведет к генерации статистически необоснованных правил.

Поиск ассоциативных правил совсем не тривиальная задача, как может показаться на первый взгляд. Одна из проблем - алгоритмическая сложность при нахождении часто встречающих наборов элементов, т.к. с ростом числа элементов в I (| I |) экспоненциально растет число потенциальных наборов элементов.


Численные ассоциативные правила (QuantitativeAssociationRules)

При поиске ассоциативных правил задача была существенно упрощена. По сути все сводилось к тому, присутствует в транзакции элемент или нет. Т.е. если рассматривать случай рыночной корзины, то мы рассматривали два состояния: куплен товар или нет, проигнорировав, например, информацию о том, сколько было куплено, кто купил, характеристики покупателя и т.д. И можно сказать, что рассматривали "булевские" ассоциативные правила. Если взять любую базу данных, каждая транзакция состоит из различных типов данных: числовых, категориальных и т.д. Для обработки таких записей и извлечения численных ассоциативных правил был предложен алгоритм поиска [4].

Пример численного ассоциативного правила: [Возраст: 30-35] и [Семейное положение: женат] [Месячный доход: 1000-1500 тугриков].

Помимо описанных выше ассоциативных правил существуют косвенные ассоциативные правила, ассоциативные правила c отрицанием, временные ассоциативные правила для событий связанных во времени и другие.

Как было сказано, задача поиска ассоциативных правил впервые была представлена для анализа рыночной корзины. Ассоциативные правила эффективно используются в сегментации <#"center">.2 Apriori - масштабируемый алгоритм поиска ассоциативных правил


Современные базы данных имеют очень большие размеры, достигающие гига - и терабайтов, и тенденцию к дальнейшему увеличению. И поэтому, для нахождения ассоциативных правил требуются эффективные масштабируемые алгоритмы, позволяющие решить задачу за приемлемое время. Об одном из таких алгоритмов и пойдет речь в данной статье. Мы опишем алгоритм Apriori. Терминология и обозначения, которыми мы будем пользоваться, даны в статье "Введение в анализ ассоциативных правил".

Для того, чтобы было возможно применить алгоритм, необходимо провести предобработку данных: во-первых, привести все данные к бинарному виду; во-вторых, изменить структуру данных.


Таблица 1

Обычный вид базы данных транзакций:

Номер транзакцииНаименование элементаКоличество1001А21001D31001E11002А21002F11003B21003A21003C2

Таблица 2

Нормализованный вид:

TIDABCDEFGHIK. 10011001100000…10021000010000…10031110000010…

Количество столбцов в таблице равно количеству элементов, присутствующих в множестве транзакций D. Каждая запись соответствует транзакции, где в соответствующем столбце стоит 1, если элемент присутствует в транзакции, и 0 в противном случае. (см. Определение 1). Заметим, что исходный вид таблицы может быть отличным от приведенного в таблице 1. Главное, чтобы данные были преобразованы к нормализованному виду, иначе алгоритм не применим.

Более того, как видно из таблицы, все элементы упорядочены в алфавитном порядке (если это числа, они должны быть упорядочены в числовом порядке). Как вы, наверное, уже догадались, это сделано неслучайно. Но, не будем забегать вперед, всему свое время.

Итак, данные преобразованы, теперь можно приступить к описанию самого алгоритма. Как было сказано в предыдущей статье, такие алгоритмы работают в два этапа, не является исключением и рассматриваемый нами алгоритм Apriori. На первом шаге необходимо найти часто встречающиеся наборы элементов, а затем, на втором, извлечь из них правила. Количество элементов в наборе будем называть размером набора, а набор, состоящий из k элементов, - k-элементным набором.


Свойство анти-монотонности

Выявление часто встречающихся наборов элементов - операция, требующая много вычислительных ресурсов и, соответственно, времени. Примитивный подход к решению данной задачи - простой перебор всех возможных наборов элементов. Это потребует O (2|I|) операций, где |I| - количество элементов. Apriori использует одно из свойств поддержки, гласящее: поддержка любого набора элементов не может превышать минимальной поддержки любого из его подмножеств. Например, поддержка 3-элементного набора (Хлеб, Масло, Молоко) будет всегда меньше или равна поддержке 2-элементных наборов (Хлеб, Масло), (Хлеб, Молоко), (Масло, Молоко). Дело в том, что любая транзакция, содержащая (Хлеб, Масло, Молоко), также должна содержать (Хлеб, Масло), (Хлеб, Молоко), (Масло, Молоко), причем обратное не верно.

Это свойство носит название антимонотонности и служит для снижения размерности пространства поиска. Не имей мы в наличии такого свойства, нахождение многоэлементных наборов было бы практически невыполнимой задачей в связи с экспоненциальным ростом вычислений.

Свойству антимонотонности можно дать и другую формулировку: с ростом размера набора элементов поддержка уменьшается, либо остается такой же. Из всего вышесказанного следует, что любой k-элементный набор будет часто встречающимся тогда и только тогда, когда все его (k-1) - элементные подмножества будут часто встречающимися.

Все возможные наборы элементов из I можно представить в виде решетки, начинающейся с пустого множества, затем на 1 уровне 1-элементные наборы, на 2-м - 2-элементные и т.д. На k уровне представлены k-элементные наборы, связанные со всеми своими (k-1) - элементными подмножествами.

Рассмотрим рисунок 1, иллюстрирующий набор элементов I - (A, B, C, D). Предположим, что набор из элементов (A, B) имеет поддержку ниже заданного порога и, соответственно, не является часто встречающимся. Тогда, согласно свойству антимонотонности, все его супермножества также не являются часто встречающимися и отбрасываются. Вся эта ветвь, начиная с (A, B), выделена фоном. Использование этой эвристики позволяет существенно сократить пространство поиска.



Алгоритм Apriori

На первом шаге алгоритма подсчитываются 1-элементные часто встречающиеся наборы. Для этого необходимо пройтись по всему набору данных и подсчитать для них поддержку, т.е. сколько раз встречается в базе.

Следующие шаги будут состоять из двух частей: генерации потенциально часто встречающихся наборов элементов (их называют кандидатами) и подсчета поддержки для кандидатов.

Описанный выше алгоритм можно записать в виде следующего псевдокода:

.F1 = (часто встречающиеся 1-элементные наборы)

2.для (k=2; Fk-1<>; k++) (

.Ck = Apriorigen (Fk-1) // генерация кандидатов

.для всех транзакций t T (

.Ct = subset (Ck, t) // удаление избыточных правил

.для всех кандидатов c Ct

.c. count ++

.)

.Fk = ( c Ck | c. count>= minsupport) // отбор кандидатов

.)

.Результат Fk

Опишем функцию генерации кандидатов. На это раз нет никакой необходимости вновь обращаться к базе данных. Для того, чтобы получить k-элементные наборы, воспользуемся (k-1) - элементными наборами, которые были определены на предыдущем шаге и являются часто встречающимися.

Вспомним, что наш исходный набор хранится в упорядоченном виде. Генерация кандидатов также будет состоять из двух шагов.

.Объединение. Каждый кандидат Ck будет формироваться путем расширения часто встречающегося набора размера (k-1) добавлением элемента из другого (k-1) - элементного набора.

2.Приведем алгоритм этой функции Apriorigen в виде небольшого SQL-подобного запроса.

.insertintoCk select p. item1, p. item2, …, p. itemk-1, q. itemk-1 From Fk-1 p, Fk-1 q where p. item1= q. item1, p. item2 = q. item2, …, p. itemk-2 = q. itemk-2, p. itemk-1< q. itemk-1

.Удаление избыточных правил. На основании свойства анти-монотонности, следует удалить все наборы c Ck если хотя бы одно из его (k-1) подмножеств не является часто встречающимся.

После генерации кандидатов следующей задачей является подсчет поддержки для каждого кандидата. Очевидно, что количество кандидатов может быть очень большим и нужен эффективный способ подсчета. Самый тривиальный способ - сравнить каждую транзакцию с каждым кандидатом. Но это далеко не лучшее решение. Гораздо быстрее и эффективнее использовать подход, основанный на хранении кандидатов в хэш-дереве. Внутренние узлы дерева содержат хэш-таблицы с указателями на потомков, а листья - на кандидатов. Это дерево нам пригодится для быстрого подсчета поддержки для кандидатов.

Хэш-дерево строится каждый раз, когда формируются кандидаты. Первоначально дерево состоит только из корня, который является листом, и не содержит никаких кандидатов-наборов. Каждый раз когда формируется новый кандидат, он заносится в корень дерева и так до тех пор, пока количество кандидатов в корне-листе не превысит некоего порога. Как только количество кандидатов становится больше порога, корень преобразуется в хэш-таблицу, т.е. становится внутренним узлом, и для него создаются потомки-листья. И все примеры распределяются по узлам-потомкам согласно хэш-значениям элементов, входящих в набор, и т.д. Каждый новый кандидат хэшируется на внутренних узлах, пока он не достигнет первого узла-листа, где он и будет храниться, пока количество наборов опять же не превысит порога.

Хэш-дерево с кандидатами-наборами построено, теперь, используя хэш-дерево, легко подсчитать поддержку для каждого кандидата. Для этого нужно "пропустить" каждую транзакцию через дерево и увеличить счетчики для тех кандидатов, чьи элементы также содержатся и в транзакции, т.е. CkTi = Ck. На корневом уровне хэш-функция применяется к каждому элементу из транзакции. Далее, на втором уровне, хэш-функция применяется ко вторым элементам и т.д. На k-уровне хэшируется k-элемент. И так до тех пор, пока не достигнем листа. Если кандидат, хранящийся в листе, является подмножеством рассматриваемой транзакции, тогда увеличиваем счетчик поддержки этого кандидата на единицу.

После того, как каждая транзакция из исходного набора данных "пропущена" через дерево, можно проверить удовлетворяют ли значения поддержки кандидатов минимальному порогу. Кандидаты, для которых это условие выполняется, переносятся в разряд часто встречающихся. Кроме того, следует запомнить и поддержку набора, она нам пригодится при извлечении правил. Эти же действия применяются для нахождения (k+1) - элементных наборов и т.д.

После того как найдены все часто встречающиеся наборы элементов, можно приступить непосредственно к генерации правил.

Извлечение правил - менее трудоемкая задача. Во-первых, для подсчета достоверности правила достаточно знать поддержку самого набора и множества, лежащего в условии правила. Например, имеется часто встречающийся набор (A, B, C) и требуется подсчитать достоверность для правила AB C. Поддержка самого набора нам известна, но и его множество (A, B), лежащее в условии правила, также является часто встречающимся в силу свойства антимонотонности, и значит его поддержка нам известна. Тогда мы легко сможем подсчитать достоверность. Это избавляет нас от нежелательного просмотра базы транзакций, который потребовался в том случае если бы это поддержка была неизвестна.

Чтобы извлечь правило из часто встречающегося набора F, следует найти все его непустые подмножества. И для каждого подмножества s мы сможем сформулировать правило s (F - s), если достоверность правила conf (s (F - s)) = supp (F) /supp (s) не меньше порога minconf.

Заметим, что числитель остается постоянным. Тогда достоверность имеет минимальное значение, если знаменатель имеет максимальное значение, а это происходит в том случае, когда в условии правила имеется набор, состоящий из одного элемента. Все супермножества данного множества имеют меньшую или равную поддержку и, соответственно, большее значение достоверности. Это свойство может быть использовано при извлечении правил. Если мы начнем извлекать правила, рассматривая сначала только один элемент в условии правила, и это правило имеет необходимую поддержку, тогда все правила, где в условии стоят супермножества этого элемента, также имеют значение достоверности выше заданного порога. Например, если правило A BCDE удовлетворяет минимальному порогу достоверности minconf, тогда AB CDE также удовлетворяет. Для того, чтобы извлечь все правила используется рекурсивная процедура. Важное замечание: любое правило, составленное из часто встречающегося набора, должно содержать все элементы набора. Например, если набор состоит из элементов (A, B, C), то правило A B не должно рассматриваться.

2.3 FPG - альтернативный алгоритм поиска ассоциативных правил


Узким местом в алгоритме a priori <#"center">Алгоритм Frequent Pattern-Growth Strategy (FPG)

В основе метода лежит предобработка базы транзакций, в процессе которой эта база данных преобразуется в компактную древовидную структуру, называемую Frequent-PatternTree - дерево популярных предметных наборов (откуда и название алгоритма). В дальнейшем для краткости будем называть эту структуру FP-дерево. К основным преимуществам данного метода относятся:

.Сжатие БД транзакций в компактную структуру, что обеспечивает очень эффективное и полное извлечение частых предметных наборов;

2.При построении FP-дерева используется технология разделения и захвата (англ.: divideandconquer), которая позволяет выполнить декомпозицию одной сложной задачи на множество более простых;

3.Позволяет избежать затратной процедуры генерации кандидатов, характерной для алгоритма a priori <#"justify">Рассмотрим работу алгоритма FPG на конкретном примере. Пусть имеется БД транзакций (табл.1).


Таблица 1

NПредметный набор 1a b c d e 2a b c 3a c d e4b c d e 5b c 6b d e 7c d e

Для данной БД требуется обнаружить все популярные предметные наборы с минимальной поддержкой, равной 3, используя алгоритм FPG.

.Производится первое сканирование БД транзакций, и отбирается множество часто встречающихся предметов, т.е. предметов, которые встречаются три или более раза.

Упорядочим обнаруженные частые предметы в порядке возрастания их поддержки и получим следующий набор: (c,6), (b,5), (d,5), (e,5), (a,3).

2.Построим FP-дерево. Сначала упорядочим предметы в транзакциях по убыванию значений их поддержек (табл.2).


Таблица 2

N Исходный предметный набор Упорядоченный предметный набор 1a b c d e c b d e a 2a b c c b a 3a c d e c d e a 4b c d e c b d e 5b c c b 6b d e b d e 7c d e c d e

Сначала создадим начальный (корневой) узел FP-дерева, который обычно обозначают ROOT (от англ. root - корень).

Начнем построение дерева с транзакции №1 для упорядоченных предметных наборов, т.е. (c b d e a), рис.1. При построении дерева будем придерживаться следующего правила.

Правило 1. Если для очередного предмета в дереве встречается узел, имя которого совпадает с именем предмета, то предмет не создает нового узла, а индекс соответствующего узла в дереве увеличивается на 1. В противном случае для этого предмета создается новый узел и ему присваивается индекс 1.


Рис.1. Построение FP-дерева на транзакции № 1


Сначала берем предмет с из транзакции №1. Поскольку он является первым, то формируем для него узел и соединяем с родительским (корневым) (рис.1, а). Затем берем следующий предмет b и поскольку других узлов с тем же именем дерево пока не содержит, добавляем его в виде нового узла, потомка узла с (рис 1, б). Таким же образом формируем узлы для предметов d, e и a из транзакции № 1 (случаи в, г, и д на рис 1). На этом использование первой транзакции для построения дерева закончено.

Для транзакции № 2, содержащей предметы c, b и a, выбираем первый предмет, c. Поскольку дочерний узел с таким именем уже существует, то в соответствии с правилом построения дерева новый узел не создается, а добавляется к уже имеющемуся (рис.2, а). При добавлении следующего предмета b используем то же правило: поскольку узел b является дочерним по отношению к текущему (т.е. c), то мы также не создаем новый узел, а увеличиваем индекс для имеющегося (рис.2, б). Для следующего предмета из второй транзакции a в соответствии с правилом построения FP-дерева придется создать новый узел, поскольку у узла b дочерние узлы с именем a отсутствуют (рис.2, в).


Рис.2. Построение FP-дерева на транзакции № 2


И, наконец, последняя транзакция № 7, содержащая предметный набор (c d e), увеличит на 1 индексы соответствующих узлов. Получившееся дерево, которое также является результирующим для всей БД транзакций, представлено на рис.7.


Рис.7. Результирующее дерево, построенное по всей БД транзакций


Таким образом, после первого прохода базы данных и выполнения соответствующих манипуляций с предметными наборами мы построили FP-дерево, которое в компактном виде представляет информацию о частых предметных наборах и позволяет производить их эффективное извлечение, что и делается на втором сканировании БД.

Представление базы данных транзакций в виде FP-дерева очевидно. Если в исходной базе данных каждый предмет повторяется многократно, то в FP-дереве каждый предмет представляется в виде узла, а его индекс указывает на то, сколько раз данный предмет появляется. Иными словами, если предмет в исходной базе данных транзакций появляется 100 раз, то в дереве для него достаточно создать узел и установить индекс 100.


Извлечение частых предметных наборов из FP-дерева

Для каждого предмета в FP-дереве, а точнее, для связанных с ними узлов, можно указать путь, т.е. последовательность узлов, которую надо пройти от корневого узла до узла, связанного с данным предметом. Если предмет представлен в нескольких ветвях дерева (что чаще всего и происходит), то таких путей будет насколько. Например, для FP-дерева на рис.7 для предмета a можно указать 3 пути: (cbdea, cba, cdea). Такой набор путей называется условным базисом предмета (англ.: conditionalbase). Каждый путь в базисе состоит из двух частей - префикса и суффикса. Префикс - это последовательность узлов, которые проходит путь для того чтобы достичь узла, связанного с предметом. Суффикс - это сам узел, к которому "прокладывается" путь. Таким образом, в условном базисе все пути будут иметь различные префиксы и одинаковый суффикс. Например, в пути cbdea префиксом будет cbde, а суффиксом - a.

Процесс извлечения из FP-дерева частых предметных наборов будет заключаться в следующем.

.Выбираем предмет (например, a) и находим в дереве все пути, которые ведут к узлам этого предмета Иными словами, для a это будет набор (cbdea, cba, cdea). Затем для каждого пути подсчитываем, сколько раз данный предмет встречается в нем, и записываем это в виде (cbdea, 1), (cba, 1) и (cdea, 1).

2.Удалим сам предмет (суффикс набора) из ведущих к нему путей, т.е. (cbdea, cba, cdea). После это останутся только префиксы: (cbde, cb, cde).

.Подсчитаем, сколько раз каждый предмет появляется в префиксах путей, полученных на предыдущем шаге, и упорядочим в порядке убывания этих значений, получив новый набор транзакций.

.На его основе построим новое FP-дерево, которое назовем условным FP-деревом (conditional FP-tree), поскольку оно связано только с одним объектом (в нашем случае, a).

.В этом FP-дереве найдем все предметы (узлы), для которых поддержка (количество появлений в дереве) равна 3 и больше, что соответствует заданному уровню минимальной поддержки. Если предмет встречается два или более раза, то его индексы, т.е. частоты появлений в условном базисе, суммируются.

.Начиная с верхушки дерева, записываем пути, которые ведут к каждому узлу, для которого поддержка/индекс больше или равны 3, возвращаем назад предмет (суффикс шаблона), удаленный на шаге 2, и подсчитываем индекс/поддержку, полученную в результате. Например, если предмет a имеет индекс 3, то можно записать (c b a,3), что и будет являться популярным предметным набором.

Префиксы путей, ведущих в условном дереве к узлам, связанным с предметом e, будут: (c b d e,2) (c d e,2) (b d e, 1). Подсчитав суммарную поддержку каждого предмета в условном дереве и упорядочив предметы по ее убыванию, получим: (d,5), (c,4), (b,3). Следовательно, популярными предметными наборами для предмета e будут: (d, e,5), (d, c, e,4), (d, b, e,3).

Таким образом, мы получили следующие популярные предметные наборы: (c, a,3), (c, b,4), (c, d,4), (b, d,3), (d, e,5), (d, c, e,4), (d, b, e,3).

Сравнительные исследования классического алгоритма a priori <#"248" src="doc_zip35.jpg" />

Рис. 12. Сравнение алгоритмов FPG и a priori


3Модуль поддержки принятия управленческих решений

В данной главе рассматривается программная реализация FPG-алгоритма метода поиска ассоциативных правил, построение графиков приобретения услуг и расчета загруженности персонала.

Дается описание созданного информационного модуля, его структуры и руководство пользователя и программиста.

Назначение и общие сведения о модуле ППУР

Модуль поддержки принятия управленческих решений на медицинском предприятии предназначен для помощи и сокращения времени принятия управленческих решений директором клиники.

Исходными данными для работы модуля являются данные из БД информационной системы ОАО "Центр Эндохирургических технологий".

Функциональное назначение разработанного модуля состоит в комплексной поддержке принятия управленческих решений.

Эксплуатационное назначение системы:

-обеспечение поддержки принятия решений для директора медицинского предприятия;

Состав основных выполняемых функций:

-поиск ассоциативных правил в БД ОАО "Центр Эндохирургических технологий";

-построение графиков приобретения услуг;

-расчет загруженности персонала

Техническое обеспечение.

Информационная система разработана в среде визуального программирования Borland Developer Studio на языке Delphi. Минимальные требования к аппаратному и программному обеспечению компьютера для надежной работы программного модуля следующие:

-операционная система: WindowsXP, Vista, 7;

-процессор: Pentium - 4 и выше;

-оптимальный объем оперативной памяти: 512Mb;

-минимальный объем свободного дискового пространства: 10Mb (не считая места, отводимого под данные).

Модуль состоит из пяти блоков: пользовательский интерфейс, нормализатор БД; поиск ассоциативных правил; построение графиков приобретения услуг; загруженность персонала.

Структура информационной системы

В структуре разработанной информационной системы выделяются пять основные подсистем (рисунок 7):

-подсистема нормализации базы данных

-подсистема поиска ассоциативных правил

-подсистема расчета и построения графиков приобретения услуг

-подсистема расчета коэффициента загруженности персонала

-подсистема считывания базы данных.


Рисунок 9 - Структура модуля ППУР


Описание основных подсистем

Подсистема нормализации базы данных

Для корректной работы алгоритма поиска ассоциативных правил требуется нормализация базы данных. Данная подсистема отвечает за корректную конвертацию данных из исходной БД в формат, пригодный для работы алгоритма.


Таблица 5 - Пример участка исходной БД

КлиентУслугаКоличествоВрач13311212

Таблица 6 - Пример нормализованного участка исходной БД из таблицы 5

КлиентУслуга 1Услуга 2Услуга 3Услуга. 1013.

Подсистема считывает данные из исходной БД с помощью подсистемы считывания и осуществляет поиск транзакций с одним и тем же идентификатором клиента. После прохождения всей БД формируется новая таблица размерности n на m, где n - число клиентов, m - число всех предоставляемых услуг. Данная таблица хранится в создаваемом подсистемой файле и используется подсистемой поиска ассоциативных правил.

Создание отдельного файла для хранения нормализованной БД обусловлено необходимостью увеличения надежности процесса поиска ассоциативных правил за счет разбиения всего процесса на две части: считывание БД и ее нормализация и поиск ассоциативных правил. Данная необходимость возникает из-за большого (~5-10c) времени считывания и нормализации БД и (~3-5с) времени поиска ассоциативных правил.

Подсистема поиска ассоциативных правил

Данная подсистема предназначена для поиска ассоциативных правил на основе файла с нормализованной БД, полученного после работы подсистемы нормализации БД.

Поиск ассоциативных правил осуществляется с помощью FPG-алгоритма.

Результатом работы данной подсистемы является таблица ассоциативных правил.

Подсистема расчета и построения графиков приобретения услуг

Данная подсистема предназначена для представления информации о продажах услуг за выбранный период времени в наглядной форме (в виде графиков).

Подсистема использует данные о транзакциях из корпоративной БД (полученных с помощью модуля считывания), на основе которых производится суммирование приобретенных услуг за выбранный период времени. Вывод результатов осуществляется в графическом виде.

Подсистема расчета коэффициента загруженности персонала

Данная подсистема предназначена для расчета и отображения информации о занятости персонала.

Входными данными для подсистемы являются данные из корпоративной БД (полученные подсистемой считывания). Для каждого работника рассчитывается коэффициент загруженности на основе транзакций с оказанными услугами, длительности услуг и установленными рабочими часами для данного работника. Результат предоставляется в виде таблицы с возможностью сортировки.

Подсистема считывания базы данных.

Данная подсистема предназначена для обеспечения корректного считывания информации из базы данных, которое необходимо для работы остальных подсистем модуля.

Руководство пользователя

Порядок работы с модулем ППУР

Для того, чтобы начать работу с модулем необходимо нажать на соответствующую кнопку в главном меню корпоративной информационной системы. После чего будет открыта основная форма модуля рисунок х.


Рисунок 10. Основная форма модуля.


На этой форме пользователь может выбрать интересующую его функцию или закрыть окно модуля.

Выбрав "График приобретенных услуг" пользователь попадает на новую форму (Рисунок х2).


Рисунок 11 - График приобретения услуг


В поле справа находится список всех услуг, загружаемый из БД, а также два поля даты, указывающие временной интервал построения. Пользователь выбирает интересующую его услугу, затем вводит даты с и по и нажимает кнопку рассчитать. После этого в левой части окна рисуется график зависимости количества приобретенных услуг от времени.

Выбрав "Загруженность персонала" из главного окна пользователь попадает на новую форму (рисунок х3).


Рисунок 12 - Форма загруженности персонала.


В данной форме пользователь указывает временой интервал и опции сортировки. Отсортировать результат можно по возрастанию или убыванию коэффициента загруженности или по алфавиту. Для получения результата необходимо нажать на кнопку "Рассчитать". Результат выдается в форме отсортированной таблицы слева.

Выбрав "Поиск ассоциативных правил" пользователь попадает на новую форму (Рисунок 13).


Рисунок 13 - Форма ассоциативных правил.


Здесь пользователю предлагается выбрать диапазон поддержки и ограничение на размер наборов (по умолчанию ограничения нет). После нажатия на кнопку "Рассчитать" в таблицу слева заносятся ассоциативные правила с их поддержками. Таблица сортируется по убыванию поддержки.

Выход из модуля ППУР производится по закрытию окна главного меню.

Возможные неисправности программного обеспечения

Во время работы программного обеспечения могут возникать ошибки, которые можно подразделить на внутренние и внешние. Внешние ошибки связаны с отказом операционной системы, в среде которой работает программное обеспечение. Они могут быть вызваны сбоями аппаратного обеспечения, файловой структуры операционной системы и так далее. Внутренние ошибки не связаны с состоянием среды функционирования ПО, а обусловлены неисправностями самого программного обеспечения. Основная причина возникновения внутренних ошибок - недостатки в процессе проектирования ПО. Также вероятной причиной возникновения внутренних ошибок может заключаться в некорректности исходных данных.

Руководство программиста

Программные средства представляет собой совокупность классов, которые представлены на рисунке 17.


Рисунок 14 - Диаграмма классов


1.ТClient - класс работает с базой данных, а именно с таблицей Clients (загружает и подготавливает информацию для расчетов).

2.ТStaff - класс работает с базой данных, а именно с таблицей Staff (загружает и подготавливает информацию для расчетов).

3.ТServicesкласс работает с базой данных, а именно с таблицей Services (загружает и подготавливает информацию для расчетов).

4.Transaction - класс также работает с базой данных, но загружает данные из всех таблиц в одну, формируя таблицу транзакций, которая также используется для расчетов и отображения.

5.TDataBaseEntity - класс от которого наследуются все классы сущности. Он содержит необходимые методы и поля для загрузки информации из БД.

6.ТController - обеспечивает передачу необходимых данных между всеми другими классами и слоями. (Например, передачу данных от классов сущностей к калькулятору или от калькулятора на формы)

7.ТCalculate - содержит алгоритмы и производит все математические расчеты


Выводы по разделу 3


Программное обеспечение, описанное выше, обладает достаточным функционалом для решения следующих задач: поиск ассоциативных правил в корпоративной базе данных ОАО "Центр Эндохирургических технологий", построение графиков приобретения услуг, расчет загруженности перснонала.

Данное программное обеспечение имеет удобный пользовательский интерфейс, что обеспечивается простотой работы с модулем (небольшое число форм и параметров для расчета), а также возможностью доработки за счет предоставления исходного текста программного модуля и руководства программиста.

4. Эффективность применения модуля поддержки принятия управленческих решений и полученные с его помощью результаты


4.1 Эффективность модуля ППУР


Эффективность применения модуля ППУР можно оценить, рассмотрев эффективность каждой из его функций в отдельности.


Эффективность поиска ассоциативных правил

Эффективность поиска ассоциативных правил обуславливается эффективностью применения данного подхода к корпоративной БД ОАО "Центр Эндохирургических технологий" и эффективностью самого алгоритма.

Эффективность FPG-алгоритма и его преимущества над алгоритмом Aprioriбыли рассмотрены во второй части. И, хотя для такой небольшой корпоративной БД разница во времени обработки результатов не так заметна, с расширением медицинского предприятия преимущества выбранного алгоритма будут сказываться все сильнее.

Таким образом выбранный алгоритм можно считать эффективным и оправданным.

Эффективность применения самого метода ассоциативных правил для осуществления поддержки принятия управленческих решений на медицинском предприятии не так очевидна в силу:

·высокой степени стандартизации процедур оказания услуг

·небольшим вкладом свободы выбора пользователя на наборы покупаемых им услуг

·относительно небольшим размером медицинского учреждения

Результатами работы алгоритма становилось обнаружение большого числа наборов с высокой степенью поддержки. Примерно 90% наборов оказались очевидными, еще 5% неинформативными. Но оставшиеся 5% представляли реальный интерес. Несмотря на очень хорошую осведомленность руководства о процессе оказания услуг на предприятии был обнаружен ряд "интересных" наборов, анализ которых привел к корректировки пакетов оказываемых клиникой услуг и работы некоторых отделений медицинского предприятия. (подробнее в разделе 4.2.1 Результаты поиска ассоциативных правил).

Поиск ассоциативных правил показал себя как эффективный способ поддержки принятия управленческих решений несмотря на описанные выше сложности. В перспективе внедрение данного метода в медицинские информационные системы городского, краевого и федерального масштаба многократно увеличит его эффективность и позволит обнаруживать не только популярные наборы приобретенных услуг, но и случаи неправильного лечения, нецелевого использования медикаментов, социальные тренды в области здравоохранения и много другое.


Эффективность графиков приобретения услуг

Эффективность графического представления о приобретенных пользователями услуг состоит в возможности быстро получить наглядную информацию. Раньше за построения таких графиков на медицинском предприятии отвечал секретарь, теперь же эту работу выполняет модуль ППУР, что экономит время и в конечном счете средства предприятия.


Эффективность оценки загруженности персонала

Эффективность данной функции заключается в возможности сравнить загруженность различных специалистов и отделов медицинского предприятия.

Хотя получаемый программой коэффициент в силу многих субъективных причин не дает полного представления о загруженности того или иного специалиста, получаемой информации достаточно для пересмотра графиков работы персонала, принятия решений об увольнении или найме новых работников, корректировке списка предоставляемых услуг (подробнее в разделе 4.2.3 Результаты оценки загруженности персонала).


4.2 Полученные результаты


В данном разделе представлены результаты работы модуля ППУР.


Результаты поиска ассоциативных правил

Результатом работы алгоритма поиска ассоциативных правил стало обнаружение огромного количества наборов разной размерности и разной поддержки. В силу специфики работы медицинского предприятия полученные наборы можно охарактеризовать:

·Высоким уровнем поддержки (для некоторых троичных и четверных наборов более 100)

·Большой размерностью наборов (были обнаружены наборы из четырех и пяти элементов)

Реализованная возможность фильтрации наборов ассоциативных правил (возможность вводить ограничение на размер и поддержку) позволило в значительной мере упростить анализ полученных результатов.


Рисунок 15 - Пример найденных ассоциативных правил.


В ходе анализа был выявлен ряд случаев, когда для одного и того же типа лечения получались различные наборы. Так, например, для операции лапороскопическаягерниопластика было выявлено два набора: Консультация 1; Лап_Герниопластика 1; Прием 1; Стационар 2; и Консультация 1; Лап_Герниопластика 1; Прием 1; Стационар 1; отличающиеся количеством дней в стационаре. Пакет услуг предоставляемый клиникой на эту операцию предусматривал один день стационара, в то время как в большинстве случаев (61%) клиент оставался в стационаре на еще один дополнительный день, за который приходилось платить отдельно. Это происходило в силу различного протекания реабилитации у пациентов, а также из-за разного времени попадания в стационар. Итогом стал пересмотр данного пакета услуг и включение дополнительного дня в стационаре.

Еще одним результатом работы алгоритма стало обнаружение наборов с хорошей поддержкой, которые показывали что различные клиенты приобретали несколько пакетов услуг, которые не были ранее связаны в один комплекс. Например, был обнаружен набор Консультация 2; Гистероскопия 1; Лап_Миомэктомия 1; Прием 3; Стационар 2; с поддержкой 31. Этот результат привел руководство клиники к решению о создании комплекса "Гистероскопия и Лапороскопическая Миомэктомия", который предусматривал скидку на проведение второй операции, которая должна была привлекать клиентов к повторному обращению в клинику для продолжения лечения.

Благодаря данному алгоритму было также получено множество закономерностей, которые могли бы быть "интересными" на большем предприятии, но не представляющие интерес на малом в силу их очевидности.


Результаты построения графиков приобретенных услуг

Результатами построения графиков приобретенных услуг стало более точное представление руководства об объеме и временном распределении оказываемых медицинским предприятием услуг в целом и о доле каждой услуги в частности.


Рисунок 16 - Годовой график приобретения услуги "Ректороманоскопия".


Благодаря продемонстрированной графиками динамики приобретения клиентами услуг во времени, руководство смогло скорректировать работу медицинского предприятия по сезонам. Например, помимо очевидного летнего спада в приобретении услуг, был обнаружен пик спроса, приходящийся на сентябрь. Итогами стало более грамотное распределение отпусков для персонала, а также готовность по необходимости привлечь дополнительные кадры.


Результаты оценки загруженности персонала

Результатом оценки загруженности персонала стало более детальное понимание руководством степени загруженности специалистов. Например, было обнаружено, что наиболее загруженным специалистом оказалась врач гинеколог Кривонос Татьяна Александровна, что отражает реальное положение вещей. В итоге была проведена консультация с этим специалистом и принято решение об увеличение ее приемных часов и, соответственно, повышение зарплаты. Так же было проведено сравнение загруженности специалистов одних направления и выявлена неравномерность в распределении нагрузок.


Рисунок 17 - Оценка загруженности персонала за месяц.


Выводы по разделу 4


Модуль поддержки принятия управленческих решений на медицинском предприятии, внедренный в информационную систему ОАО "Центр Эндохирургических технологий" зарекомендовал себя как эффективное средство поддержки принятия решений и доказал свою эффективность, показав реальные результаты и позволив руководству клиники провести коррективы своей работы, основываясь на полученных модулям результатах.

Сноски


Систе?ма подде?ржки приня?тия реше?ний (СППР) (англ. <http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D0%B3%D0%BB%D0%B8%D0%B9%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA>Decision Support System, DSS) - компьютерная <http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80> автоматизированная система <http://ru.wikipedia.org/wiki/%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0>, целью которой является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности. СППР возникли в результате слияния управленческих информационных систем <http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0> и систем управления базами данных <http://ru.wikipedia.org/wiki/%D0%A1%D0%A3%D0%91%D0%94>. [1].


Содержание Введение 1. Теоретическая часть 1.1 Определение DSS (СППР) 1.2 Общая схема принятия решений 1.3 Классификация СППР Классификаци

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ