Разработка автоматизированных систем идентификации человека на основе биометрических признаков

 

Оглавление


Введение

Глава 1. Обзор литературы и постановка задачи

1.1.Постановка задачи

1.2. Существующие алгоритмы и методы

1.2.1.Алгоритмы и методы определения объектов в видеопоследовательностях

1.2.2. Алгоритмы и методы динамического отслеживания объектов в видеопоследовательностях

1.2.3. Алгоритмы и методы распознавания лиц

1.3.Существующие программные средства

1.3.1.Emgu CV

1.3.2.AForge.NET

1.3.3.Cognitec FaceVACS SDK и FaceVACS VideoScan

1.3.4. Visage Technologies Face Track

1.3.5.Kinect Face Tracking (Microsoft)

1.3.6.Microsoft Research Face SDK

1.3.7.Intel Perceptual Computing SDK

1.3.8.VeriLook Surveillance SDK

1.3.9. Signal Processing Toolbox

1.3.10. Wavelet Toolbox

1.3.11. OpenCV

1.4. Вывод по разделу

Глава 2. Разработка алгоритмического обеспечения

2.1. Архитектура средств динамического отслеживания лиц в видеопоследовательности

2.2. Выбор базовых программных средств

2.3. Разработка алгоритмов и методов динамического отслеживания лиц

Глава 3. Экспериментальные результаты54

3.1. Результаты функционального тестирования

3.1.1. Описание тестовых баз лиц

3.1.2. Результаты тестирования алгоритма идентификации лиц

3.1.3. Результаты тестирования алгоритма поиска лиц на изображениях

3.1.4.Результаты тестирования. Отслеживание лиц в видеопоследовательности.

3.1.5. Распознавание лиц в видеопоследовательности

3.2. Результаты тестирования на больших объемах видеоданных

3.3. Выводы по разделу

Глава 4. Организационно-экономическая часть

4.1. Технико-экономическое обоснование объекта проектирования

4.2. Состав конструкторской группы и их должностные оклады

4.3. Перечень работ, выполняемых в процессе разработки алгоритма динамического отслеживания лиц и программной документации

4.4. Расчёт сметы затрат на разработку алгоритмического обеспечения комплекса программных средств для динамического отслеживания лиц

4.4.1. Смета затрат на основные и вспомогательные материалы

4.4.2. Расчет заработной платы инженерно-технических работников

4.4.3. Расчёт страховых взносов

4.4.4. Прочие денежные расходы

4.4.5. Смета затрат

4.5. Вывод по разделу

Глава 5. Безопасность и экологичность проектных решений

5.1. Цель и решаемые задачи

5.2. Опасные и вредные факторы при работе с ПЭВМ

5.3. Характеристика объекта исследования

5.4. Мероприятия по безопасности труда и сохранению работоспособности

5.4.1. Обеспечение требований эргономики и технической эстетики

5.4.2. Обеспечение оптимальных параметров воздуха рабочих зон

5.4.3 Создание рационального освещения

5.4.4. Защита от шума

5.4.5 Обеспечение режимов труда и отдыха

5.4.6 Обеспечение электробезопасности

5.4.7 Защита от статического электричества

5.4.8 Обеспечение допустимых уровней ЭМП

5.4.9 Обеспечение пожарной безопасности

5.4.10 Мероприятия и средства по защите окружающей среды

5.5. Инженерные расчеты

5.5.1. Расчет естественного освещения

5.6. Выводы по разделу

Заключение

Список литературы


Введение


На данный момент проблеме распознавания человека по изображению лица посвящено множество работ, однако в целом она ещё далека от разрешения. Основные трудности состоят в том, чтобы распознать человека по изображению лица независимо от изменения ракурса и условий освещённости при съёмке, а так же при различных изменениях, связанных с возрастом, причёской и т.д. Распознавание изображений пересекается с распознаванием образов. Такие задачи не имеют точного аналитического решения. При этом требуется выделение ключевых признаков, характеризующих зрительный образ, определение относительной важности признаков путём выбора их весовых коэффициентов и учёт взаимосвязей между признаками. Изначально эти задачи выполнялись человеком-экспертом вручную, путём экспериментов, что занимало много времени и не гарантировало качества. В новых методах выделение ключевых признаков осуществляется путём автоматического анализа обучающей выборки, но, тем не менее, большинство информации о признаках задаётся вручную. Для автоматического применения таких анализаторов выборка должна быть достаточно большой и охватывать все возможные ситуации.

Существует два класса методов: методы распознавания и отслеживания лиц и методы распознавания и отслеживания объектов.

У каждого из методов есть свои преимущества и недостатки. Методы распознавания и отслеживания объектов, в частности, удобны тем, что позволяют разпознать человека при разных углах его поворота относительно камеры, например, боком или спиной.

Распознавание человека по изображению лица выделяется среди биометрических систем тем, что, во-первых, не требуется специальное или дорогостоящее оборудование. Для большинства приложений достаточно персонального компьютера и обычной видеокамеры. Во-вторых, не нужен физический контакт с устройствами. Не надо ни к чему прикасаться или специально останавливаться и ждать срабатывания системы. В большинстве случаев достаточно просто пройти мимо или задержаться перед камерой на небольшое время. К недостаткам распознавания человека по изображению лица следует отнести то, что сама по себе такая система не обеспечивает 100%-ой надёжности идентификации. Там, где требуется высокая надёжность, применяют комбинирование нескольких биометрических методов.

В настоящее время активно развиваются биометрические технологии.

Их целью является разработка автоматизированных систем идентификации человека на основе биометрических признаков: отпечатков пальцев, характеристик голоса и речи, рисунка радужной оболочки глаза, изображения лица. Это связано с тем фактом, что на данный момент основным препятствием для дальнейшего развития информационных сред, различного рода виртуальных сервисов и т.п. является проблема надёжной идентификации (верификации) пользователя. Ожидается, что применение подобных систем существенно уменьшит количество преступлений, связанных с несанкционированным доступом, в том числе и в компьютерных сетях, причём именно технология идентификации человека на основе изображений лиц признана наиболее приемлемой для массового применения, так как она не требует физического контакта с устройством, ненавязчива, естественна и, в потенциале, может обладать высокой надёжностью и скоростью. Поиск в базах данных по фотопортретам человека, автоматизированный контроль удостоверений личности особенно актуальны для правоохранительных органов большинства стран в контексте увеличения количества террористических актов и уголовных преступлений на фоне повышения общей мобильности населения.[1]


Глава 1. Обзор литературы и постановка задачи


.1 Постановка задачи


Основной задачей дипломного проекта является разработка алгоритмического обеспечения для динамического отслеживания лиц в видеопоследовательностях. Есть два пути решения этой задачи. Первый основан на том, что на каждом отдельном кадре производится распознавание заданного лица.

Второй путь заключается в распознавании лица, как объекта, и дальнейшем его отслеживании на всей последовательности кадров. Преимущество этого варианта в том, что при таком решении задачи можно распознать человека, даже если он повернулся спиной. В данной работе будут объединены достоинства методов обоих классов.

Также, требуется протестировать полученный алгоритм на работоспособность и оценить результаты.


1.2 Существующие алгоритмы и методы


1.2.1 Алгоритмы и методы определения объектов в видеопоследовательностях

Цифровое изображение, получаемое видеокамерой в момент времени t и имеющее по вертикали h, а по горизонтали w пикселей, обозначим It(h, w). Видео-поток - это последовательность цифровых изображений (кадров) It(h, w), It+1(h, w), ..., It+k(h, w). Под прямоугольной областью интересов Obt(X, Y) понимается множество пикселей цифрового изображения It(h, w), очерчивающих искомый объект, содержащее X пикселей по вертикали и Y по горизонтали. Обнаружением объекта называется выделение области интересов Obt(X, Y) на цифровом изображении It(h, w) в момент времени t. Под обнаружением объекта в реальном времени понимается обработка видеопотока с частотой не менее 10 кадров в секунду. Обучением называется предварительная настройка и задание параметров метода для обнаружения интересующего объекта. Обучение может выполняться на основе обучающей выборки, состоящей из одного или нескольких обучающих изображений.

Под обучающим цифровым изображением понимается изображение It(h, w) с дополнительной информацией о наличии или отсутствии на нем искомого объекта. Обучающее изображение называется позитивным, если оно содержит объект, который нужно обнаружить. В противном случае обучающее изображение называется негативным.

На сегодняшний день существуют различные методы обнаружения объектов на цифровом изображении It(h, w): каскадный классификатор Виолы и Джонса, обобщенное преобразование Хафа, метод Капура-Винна и другие. Однако методы обнаружения объекта, имеющие высокие показатели надежности и устойчивости, требуют значительных временных и машинных ресурсов для обучения на новых объектах.

Методы обнаружения объекта на цифровом изображении It(h, w), по способу отнесения участка изображения к области интересов Obt(X, Y), можно разделить на две большие группы: обобщающие (generative) и различающие (discriminative).

Обобщающие методы составляют абстрактное, идеализированное представление о структуре объекта на основе позитивных обучающих изображений. Это представление называют моделью, понимая под этим понятием: схему, математическую формулу, набор данных и алгоритмов, воспроизводящих в специально оговоренном виде строение или свойства объекта. При анализе нового изображения обобщающие методы оценивают, насколько точно это изображение соответствует построенной модели. Кроме анализа имеющихся изображений обобщающие методы могут использовать полученную модель для построения новых изображений объекта. При обучении обобщающих методов негативные обучающие изображения не требуются. видеопоследовательность распознавание лицо отслеживание

Наиболее популярными моделями обобщающих методов являются: модель случайного поля, модель неявной формы, модель констелляции. В модели случайного поля изображение разбивают на небольшие участки. Каждому участку приписывается метка, которая представляет его смысловое значение, например: «вода», «небо», «земля», «объект». Кроме того, оцениваются вероятности смежного размещения двух разных меток. Совокупность назначенных меток и их вероятностей составляет случайное поле. При этом метки подбираются таким образом, чтобы получилось наиболее правдоподобное случайное поле. Модель неявной формы использует преобразование Хафа. В процессе обучения на изображении объекта выделяют характерные точки. Для каждой точки определяют радиус-вектор, который соединяет ее с геометрическим центром объекта. При обнаружении характерной точки на исследуемом изображении соответствующий радиус-вектор указывает ожидаемую позицию центра объекта. Пикселю, расположенному в этой позиции, добавляют один голос. Пиксель, набравший наибольшее количество голосов после сканирования всего изображения, будет соответствовать наиболее вероятному положению центра объекта. Модель констелляции рассматривает объект в виде совокупности элементов. На исследуемом изображении выделяют характерные участки и ставят их в соответствие элементам объекта или фона. Затем с помощью перебора отыскивают наиболее правдоподобное соответствие. Характеристики методов Капура-Винна , Феррари и Фергюса-Пероны, базирующихся соответственно на моделях случайного поля, неявной формы и констелляции, представлены в таблице 1.1.


Таблица 1.1 Сравнение методов обнаружения объектов

МетодыОбъем обучающей выборки, шт.Время обработки одного изображения, мсВерхняя оценка вычислительной сложностиОбобщающиеКапура-Винна353000КвадратичнаяФеррари481000ЛинейнаяФергюса-Пероны4002500РазличающиеВиолы Джонса1441667Лекуна24300100КвадратичнаяПапагеоргиу27159100Линейная

Различающие методы используют специальную функцию-классификатор для обнаружения объекта на цифровом изображении It(h, w). В процессе обучения они выделяют различия между позитивными и негативными обучающими изображениями. На основе этих различий они подбирают параметры функции-классификатора. Полученная функция применяется для разделения новых входных изображений на изображения, содержащие и не содержащие область интересов Obt(X, Y). Характеристики наиболее популярных различающих методов Виолы-Джонса, Лекуна и Папагеоргиу представлены в таблице.

Таким образом, различающие методы сосредоточены на различиях между позитивными и негативными изображениями конкретной обучающей выборки, в то время как обобщающие методы пытаются воссоздать структуру самого объекта по его изображениям. Поэтому при обучении обобщающих методов негативные изображения не требуются, а необходимое количество позитивных изображений существенно меньше, чем при обучении различающих методов. Вследствие чего для упрощенного обучения следует использовать подход обобщающих методов. При выборе модели обобщающего метода будем руководствоваться следующими замечаниями. Модель случайного поля требует больших вычислительных затрат, что неприемлемо для обработки видеопотока в реальном времени. Учет возможных вариаций формы объекта в модели неявной формы требует значительного увеличения количества обучающих изображений. Но модель констелляции изначально представляет объект в виде совокупности отдельных элементов. Именно в этой модели проще учитывать различные искажения геометрической формы объекта за счет изменения взаимного положения его элементов.

Предлагаемый метод будет основываться на модели констелляции, которая в качестве элементов объекта использует линии границ, выделенные на изображении объекта, совокупность которых называется каркасом изображения.[2]


1.2.2 Алгоритмы и методы динамического отслеживания объектов в видеопоследовательностях

В последнее время при организации видеонаблюдения применяются преимущественно цифровые методы обработки и хранения информации. Цифровые технологии дают ряд преимуществ перед устаревшими методами аналоговой записи на пленку. Например, в среднем качестве средний жесткий диск может хранить объем информации, соответствующий видеозаписи в течение месяца, а также обеспечивается быстрый доступ к любой части записи, что можно сделать из любой точки мира, если записывающий компьютер подключен к сети.

Компьютеры предоставляют широкие возможности по автоматической обработке изображений, которая все еще используются лишь в незначительной степени. Такие простые задачи, как выполнение записи только движений, имеют достаточно универсальные решения. Однако более сложные задачи, особенно из области компьютерного зрения, до сих пор не имеют общих решений, а предлагаемые алгоритмы, как правило, применимы только при соблюдении ряда условий и ограничений. В связи с этим, на сегодняшний день, данная область исследований представляет большой интерес, как в научном, так и в прикладном плане. Одной из важных, но до конца не решенных подзадач является автоматическое выделение движущихся объектов, что является необходимым предварительным шагом при решении таких задач видеонаблюдения, как системы контроля доступа, удаление фона, ориентация роботов в пространстве, системы помощи водителям, распознавание лиц, облегчение восприятия сцены человеческим глазом и многих других. В работе рассматривается вопрос выделения движущихся объектов на видеопоследовательностях.

Существует два основных класса методов выделения движущихся объектов:

) путем анализа их границ (контуров);

) путем анализа всей области объекта на кадрах.

Основной идеей методов первого класса является поиск отличий векторов оптического потока с последующим построением контуров движущихся объектов. Методы второго класса, наоборот, основываются на группировании сходных векторов из оптического потока в области, которые подаются на выход алгоритма в качестве движущихся объектов. Большинство классических методов анализируют не сами кадры видеопоследовательности, а оптический поток (поле видимых смещений пикселей изображений), построенный по этим кадрам.

Для сравнительного анализа построим данные методы на базе широко используемой в компьютерном зрении общедоступной библиотеки OpenCV, содержащей реализации для некоторых шагов исследуемых методов, таких как построение оптического потока, вычисление градиента и поиск контуров, а также простой и удобный интерфейс для работы с камерами и вывод результата на экран.

Для построения оптического потока используются функции из библиотеки OpenCV, реализующие алгоритмы Хорна-Шанка (Horn-Schunck), Лукаса-Канадэ (Lucas-Kanade) и метод блочного сопоставления.

Для построения контуров движущихся объектов выполняются следующие шаги:

построение оптического потока одним из предложенных выше методов;

вычисление градиента оптического потока;

построение матрицы, каждая ячейка которой соответствует модулю градиента;

нахождение контуров на основе бинаризованного поля модуля градиента.

Общая схема построения областей движущихся объектов будет включать следующие шаги:

построение оптического потока одним из предложенных выше методов;

- сравнение вектора оптического потока в каждой точке кадра с векторами в соседних точках (сравнение ведется только с точками снизу и справа от текущей точки, поскольку сравнение с точками слева и сверху уже было выполнено при рассмотрении предыдущих точек);

- если векторы сходны, то точки объединяются в область или присоединяются к уже существующей области (для пометок областей их номера записываются в соответствующие ячейки кадра).

Таким образом, после однократного прохода по изображению получим разметку на области. В качестве функции похожести векторов оптического потока для рассматриваемых методов приемлемый результат дает использования следующего условия. Если модуль разности векторов меньше одной трети длины самого короткого, то вектора похожи. Данный критерий, хотя и выглядит эвристическим, дает хороший результат и является приемлемым при сравнении эффективности разных методов выделения движущихся объектов. Коэффициент эмпирически вытекает из спектра векторов оптического потока.

Проведем сравнение различных методов выявления движущихся объектов по критериям быстродействия, сложности реализации и качества достигаемого результата. Перечисленные характеристики важны, так как для обеспечения непрерывного видеонаблюдения требуется обработка изображений в масштабе реального времени. Однако достижение необходимого быстродействия не должно приводить к ухудшению вероятностей обнаружения объектов интереса. При всем этом для возможности легкого внедрения метода в любые проекты желательно иметь простую и очевидную реализацию.

Быстродействие

Основной вклад в вычислительную сложность рассматриваемых методов вносит вычисление оптического потока, так как даже линейные реализации имеют очень большой коэффициент. Все остальные шаги алгоритмов выделения движущихся объектов - группирование векторов, вычисление градиента, поиск контуров - требуют лишь нескольких операций на каждый пиксель изображения. Данные методы можно назвать весьма производительными, если не брать в расчет вычисление оптического потока, так как способ его вычисления зависит от поставленных задач, условий и целей. К тому же все современные компьютеры имеют несколько ядер, и оптический поток может независимо вычисляться на своем ядре, не мешая остальному анализу. При обработке каждого нового кадра на все прочие расчеты, кроме оптического потока, для стандартного размера кадра (VGA - 64×480) тратится не более 10-60 млн. тактов, что приблизительно равно 4-20 мс процессорного времени для ядра с частотой 3 ГГц. Производительность зависит от интенсивности и сложности движения на видеоряде, поэтому точную алгоритмическую сложность подсчитать не возможно. Например, для неподвижной сцены все алгоритмы дают быстрый ответ об отсутствии объектов, но чем больше в сцене мелких движений, тем больше ресурсов требуется для их поиска. Конечно же, например, для метода объединения областей несложно придумать кадры, оптический поток которых имеет шахматный порядок, и анализ таких кадров будет, как минимум, кубической сложности. Но на практике такое не встречается, а движущиеся объекты имеют сгруппированные области на видеокадрах. Эта сгруппированность сохраняется и для оптического потока, что позволяет его анализировать со скоростью, немного меньшей, чем линейная. Таким образом, анализируемые методы применимы для использования на обычных компьютерах для обработки видео в реальном масштабе времени.

Сложности реализаций

Чем проще метод, тем сложнее в нем сделать неявную ошибку, и тем этот метод надежнее. Особенно это важно, когда метод встраивается как дополнительная функциональность в уже работающую систему. Использование библиотеки OpenCV позволяет упростить реализацию методов путем написания кода сравнительно небольшого объема. Для всех сложных шагов использовались стандартные функции из библиотеки, что позволяет избежать возможных ошибок при самостоятельной реализации. Для связи сложных шагов производятся только простые операции (например, передача изображений), поэтому их реализация практически очевидна, и в ней сложно допустить ошибку.

Таким образом, анализируемые методы легко реализовать, а значит, они обладают высокой надежностью.

Качество

Рассмотренные методы являются приемлемыми по скорости работы, однако необходимо оценить качество получаемого результата. Можно провести следующий эксперимент: на вход алгоритмам подадим видеоряд с бытовой видеокамеры. При стандартном комнатном освещении плавно проведем рукой перед камерой. Были опробованы как аналоговые камеры, для оцифровки сигнала которых использовались платы видеозахвата, так и различные WEB-камеры, которые подключаются к компьютеру через интерфейс USB и передают уже оцифрованный сигнал. В ходе экспериментов не выявлено существенных отличий выделяемых объектов в зависимости от использованной камеры. На рис. 1.1 для одного и того же видеоряда представлен результат работы алгоритмов поиска контура и объединения областей.


Рис. 1.1 Выделение движущейся руки на основе двух методов: поиск контуров (а); объединение областей (б)


Все сравниваемые методы дают сходный по качеству результат - алгоритмы выделили шумы как движущиеся объекты, что непригодно для дальнейшего использования. Следует заключить, что причина низкого качества результата обусловлена качеством построения оптического потока, поскольку данные методы на нем основаны. Большинство алгоритмов построения оптического потока дают приемлемый результат только на искусственных и чистых кадрах, поэтому, получив на вход видео с шумами, они не обеспечивают желаемое качество выделения объекта. Все рассмотренные стандартные методы построения оптического потока очень чувствительны к уровню шумов, что отражается в найденных движущихся объектах. В ряде случаев алгоритмы вычисляют, что движется вся сцена, хотя на самом деле движения нет вообще, а на видео - равномерный шум. Также классические методы имеют сильные ограничения в допустимой скорости движения объектов - движения медленнее, чем один пиксель за кадр, не обнаруживаются вовсе.[3]

Трассирование подразумевает отслеживание движущегося объекта и значений его параметров в течение всего времени его пребывания в кадре. При правильном трассировании объекта появляется возможность просмотра траектории движения объекта с любым уровнем детализации (с точностью до кадра, до 3, 5 и т.д. кадров). Такая возможность обеспечивается сохранением положения центральной точки объекта на каждом из кадров в специальном массиве, который введен для этой цели при определении параметров для каждого из движущихся объектов. Алгоритмы, трассирующие движущиеся объекты, не должны путать один объект с другим, терять объект, если он остановился на небольшой промежуток времени или скрылся за каким-либо препятствием (например, человек, скрывшийся за деревом), а потом появился вновь. Для этих целей великолепно подходит применение нормализованной функции взаимной корреляции. Функция взаимной корреляции двух изображений - функция, показывающая степень корреляции двух изображений. Обычно она используется для вычисления степени похожести областей на разных кадрах. Эта функция должна давать единственный максимум только для случая двух одинаковых изображений. Очень часто используется нормализованная функция взаимной корреляции. Максимальным значением функции при полном совпадении первого растра с прямоугольником на втором растре будет единица. Алгоритмы, использующие функцию корреляции, работают следующим образом. Сначала они находят несколько значений функции, различным образом накладывая на один растр прямоугольник, взятый с другого растра. Затем из полученных значений выбирают максимальное. Если наилучшее значение достаточно близко к единице, значит, на первом растре обнаружен именно тот объект, который попал в «коррелирующий» прямоугольник, взятый на втором растре. Степень близости значения функции корреляции к единице - параметр, выбирая значение которого, можно добиться оптимального соотношения количества ошибок ложного обнаружения и необнаружения вообще. Она помогает сравнить объект с одного из предыдущих кадров с объектом, обнаруженным на вновь полученном кадре и сделать вывод об их похожести. Даже если объект, который можно было посчитать исчезнувшим после того, как он пропал за каким-либо препятствием, перестал обнаруживаться, применяя алгоритм вычисления функции корреляции можно обнаружить его снова на одном из последующих кадров и продолжить трассировку, взяв параметры объекта в момент его последнего обнаружения и скорректировав их по текущему кадру. Это очень важно для построения неразрывной траектории движения. При вычислении функции корреляции с целью обнаружения на текущем кадре объекта, обнаруженного ранее, используются только те пиксели изображения, которым в маске движения соответствуют единицы. В противном случае в формулу для вычисления функции корреляции могут попасть значения цветов пикселей, лежащих внутри прямоугольной области, но за пределами объекта, а эти пиксели совсем не обязательно должны коррелировать друг с другом, следовательно, значение функции корреляции в этом случае уменьшится. А если оно станет меньше выбранного порога похожести, алгоритм может ошибочно посчитать данную прямоугольную область растра непохожей на объект, с которым производится сравнение, даже если на самом деле это не так. Очевидно, что вычислять функцию корреляции для двух объектов не имеет смысла, если линейные размеры соответствующих им прямоугольников существенно различаются, поскольку и так очевидно, что это разные объекты. Также бессмысленно, например, искать в правом нижнем углу текущего кадра объект, обнаруженный в левом верхнем углу предыдущего кадра, поскольку никакой интересующий нас объект не может за такое короткое время так существенно изменить своё местоположение. Такие допущения могут существенно сократить затраты на трассирование, в общем случае включающие вычисление функции корреляция каждого объекта с каждым. Кроме того, для объекта, испытавшего крайне малое смещение на соседних кадрах можно вообще не вычислять значения функции корреляции. Ведь ещё до выполнения данной операции становится очевидным, что два отпечатка в одной и той же области маски движения на соседних кадрах принадлежат одному и тому же объекту.


Рис. 1.2 Последовательность обработки двух следующих друг за другом кадров


Изображение вычитается из базового кадра, а затем поиском в глубину находятся области, состоящие из небелых пикселей. Области на разных кадрах, соответсствующие футболистам, обводятся в разноцветные прямоугольники. [4]


1.2.3 Алгоритмы и методы распознавания лиц

Задачи распознавания человека по изображению лица делятся на три больших класса: поиск в больших базах данных, контроль доступа и контроль фотографий в документах. Они различаются как по требованиям, предоставляемым к системам распознавания, так и по способам решения, и поэтому представляют собой отдельные классы.

Различны и требования, предъявляемые к ошибкам первого и второго рода для таких классов. Ошибкой первого рода (type I error, misdetection) называется ситуация, когда объект заданного класса не распознаётся (пропускается) системой. Ошибка второго рода (type II error, false alarm) происходит, когда объект заданного класса принимается за объект другого класса.

Следует также отметить различие понятий верификации и распознавания (идентификации). В задаче верификации неизвестный объект заявляет, что он принадлежит к некоторому известному системе классу. Система подтверждает или опровергает это заявление. При распознавании требуется отнести объект неизвестного класса к одному из известных или выдать заключение о том, что этот объект не относится к известным классам.

Сравнение типа один со многими

Высокие требования к ошибке первого рода - система распознавания должна находить изображения соответствующие данному человеку, по возможности не пропустив ни одного такого изображения. При этом допустимо, если в результирующей выборке будет присутствовать небольшое число других людей.

Обычно в большой базе данных (104-107 изображений) требуется найти изображения, наиболее похожие на заданное. Поиск должен быть произведён за разумное время. Одно из решений состоит в хранении базе данных небольших наборов заранее извлечённых ключевых признаков, максимально характеризующих изображение. При этом требования к точности не столь критичны как в задачах контроля доступа и документного контроля.

Сравнение типа один с несколькими

Критичны требования к ошибкам второго рода. Система распознавания не должна распознавать незнакомых людей как знакомых, возможно даже за счёт увеличения ошибок первого рода (отказов в доступ знакомым людям).

Имеется небольшая группа лиц (5-50 человек), которых система должна распознавать по изображению лица для доступа в некоторое место. Людей, не входящих в эту группу, система не должна пропускать. Возможны варианты, когда требуется установить конкретную личность по изображению лица. При этом от системы требуется высокая достоверность распознавания, возможно даже за счёт увеличения числа отказов на знакомые объекты.

В качестве тренировочных изображений обычно для каждого человека доступны несколько изображений лица, полученных при различных условиях. Например, различные ракурсы, освещённость, причёска, мимика, наличие очков и т.п.

Система должна работать в реальном масштабе времени, а процесс настройки может занимать больше времени и производиться отдельно. В процессе эксплуатации система должна дообучаться на вновь поступающих изображениях по возможности быстрее.

Ограничений на применяемые методы здесь нет, но все методы сходятся в одном. Имеется обучающий набор изображений лиц заданной группы людей (возможно при различных условиях съёмки). К этому набору система обращается в процессе распознавания, или система настраивается в процессе обучения на этот набор.

Распространён подход с использованием нейронных сетей, которые после обучения обладают хорошей обобщающей способностью.

Сравнение типа один к одному

Формулировать требования к ошибкам первого и второго рода здесь будет некорректно, поскольку система распознавания никогда не имела дело с поступающими на вход классами. Но желательно чтобы система не совершала ошибок при сравнении.

Требуется сравнить изображение лица человека, полученное в данный момент с фотографией из какого-либо документа. Системе надо ответить принадлежат ли эти лица одному человеку или нет. Данный класс задач наиболее сложен, поскольку, во-первых, система никогда раньше не сталкивалась с изображением лица данного человека. Система сравнивает всегда отличающиеся изображения, учёт всех возможных различий в процессе обучения или настройки системы затруднителен. Во вторых, здесь большее влияние оказывают возрастные и другие изменения лица. В третьих, качество и контраст отсканированной фотографии, как правило, хуже, чем изображение лица снятого камерой. Большинство методов для данного класса задач неприменимы без специальной адаптации.

В изученной литературе нет работ, напрямую связанных с применением нейросетевых методов для решения данного класса задач. Для этого можно предложить применение нейронных сетей (НС) для извлечения ключевых признаков изображений и адаптацию НС для сравнения двух изображений.

Инвариантностью к изменению масштаба обладают неокогнитроны, модификации нейронных сетей высокого порядка. Т.е. эти виды сетей не надо специально обучать на изображениях с различными масштабами объекта, обучившись некоторому изображению один раз, они способны затем распознавать объект на изображении при любых изменениях масштаба.

Так же инвариантностью к изменениям масштаба обладают моменты Лежандра, Зернике и т.п.

В остальных методах инвариантность к изменениям масштаба достигается на этапе предобработки (приведение к стандартному масштабу), либо в обучающую выборку включаются изображения с различным масштабом.

Большинство методов чувствительно к изменениям освещения - результат распознавания сильно ухудшается. Некоторого улучшения можно достичь за счёт выравнивания гистограммы яркостей, но в общем случае изменения в освещении предобработкой устранить невозможно.

Также используют алгоритм выделения линейных подпространств, который надёжно классифицирует человека по изображению лица при достаточно широком диапазоне условий освещённости. При этом обучающая выборка формировалась с использованием изображений при различных условиях освещения. Существуют так же различные эвристические подходы. Например, в модификации метода главных компонент, первые 2-3 компоненты отражают в основном различия в освещении, и поэтому при сравнении не учитываются.

Специфический подход - использование изображения лица, взятое в инфракрасном спектре. Это обеспечивает независимость от условий освещения, но требует специального оборудования. В большинстве методов требуется предобработка, приводящая положение лица на изображении к стандартной ориентации (горизонтальная линия глаз, вертикальная ось симметрии головы).

Инвариантностью к изменениям ориентации обладают неокогнитроны и модификации нейронных сетей высокого порядка, которым достаточно одного предъявления изображения для того, чтобы узнать объект на изображении при любом изменении ориентации объекта. Так же инвариантностью к изменениям ориентации обладают моменты Лежандра, Зернике и т.п. Инвариантностью к сдвигу обладают неокогнитроны, нейронные сети высокого порядка, автокорреляторные нейронные сети Хопфилда, а так же некоторые моменты. В остальных случаях инвариантность к сдвигу достигается предобработкой или обучением. Не существует методов распознавания изображений, инвариантных к большим изменениям ракурса (трёхмерным поворотам лица). Требуется предварительное обучение на изображениях лица в различных ракурсах.

Методы основаны на синтезе изображения в новых ракурсах по одному примеру изображения в произвольном ракурсе, и находятся в стадии разработки.

Другое решение этой проблемы заключается в использовании трёхмерного представления. Однако это требует или использования нескольких изображений при различных условиях съёмки или построения сложных трёхмерных моделей лица.

Каждое лицо отдельного человека представляет собой класс для системы распознавания. Лицо одного человека может отличаться причёской, бородой, очками, эмоциональным выражением, подвержено возрастным изменениям. Такие различия называются внутриклассовыми и создают проблемы для систем распознавания. Частично эта проблема может быть преодолена выделением областей лица, неподверженных таким изменениям. Так же это может решаться в процессе обучения. Например, в линейных дискриминантах и нейросетевых методах. Неокогнитроны могут распознавать искажённое изображение. Под помехами здесь понимается как различного вида шум на изображении, так и другие помехи, перекрывающие или искажающие части объектов на изображении.

Свойством восстанавливать изображение, наиболее близкое к исходному, обладают нейронные сети Хопфилда, автоассоциативная память и реконструкция изображения по главным компонентам.

В любом методе после преобразования изображения и выделения ключевых признаков требуется сравнить полученные признаки, для того чтобы произвести распознавание. И, несмотря на многообразие различных алгоритмов и методов распознавания, среди них можно выделить три группы методов, различающихся способами сравнения изображений, рис. 1.3.

В первой группе методов набор признаков (в простейшем случае исходное изображение) представляет собой точку в пространстве признаков, где значение каждого признака (например, яркость отдельного пикселя, значение главной компоненты, коэффициент частотного преобразования и т.п.) представляет собой координату вдоль некоторой оси пространства признаков. Процедура сравнения основывается на разделении пространства признаков на области, относящиеся к одинаковым классам.

Для этого, например, может быть вычислено расстояние от неизвестного образа до всех остальных образов при помощи какой-либо метрики. Класс может быть представлен центром кластера, тогда расстояние от неизвестного образа вычисляется до центров всех кластеров, как это делается в методе главных компонент. В мультимодальном анализе главных компонент и в радиально-базисных нейронных сетях одному классу может соответствовать несколько кластеров, рис. 1.4. Линейный дискриминант строит набор линейных разделяющих поверхностей, полагая, что классы линейно разделимы в пространстве признаков. Разновидность нейронных сетей - многослойные персептроны позволяют строить разделяющие поверхности любой сложности, рис. 1.4. Нейронные сети Хопфилда преобразуют изображение, поданное на вход к ближайшему в пространстве изображений.


Рис. 1.3 Схема способов сравнения изображений


Рис. 1.4 Слева - кластеризация, справа - разделяющие поверхности в пространстве признаков


Несмотря на то, что самые совершенные методы могут лучшим способом разбить исходное пространство на области, этого недостаточно, поскольку для реальных объектов требуется огромное количество разделяющих областей (и обучающих примеров), чтобы учесть всевозможные способы изменения изображений объектов. Это связано с тем, что даже незначительное, с человеческой точки зрения, изменение изображения (например, ракурс, освещение или наличие бороды), может дать положение в пространстве признаков, очень далеко лежащее от исходного. И система в этом случае может среагировать не на одинакового человека, а, например, на одинаковый ракурс, посчитав изображение другого человека в том же ракурсе наиболее похожим на неизвестное. Ни применение различных преобразований для начального представления изображения, ни предобработка не может решить эту проблему для общего случая.

Следующая группа методов частично преодолевает данный недостаток. На изображении находятся важные области лица (например, области глаз, бровей, носа, губ). Затем с помощью первого способа производится сравнение каждой области, и результат каждого такого сравнения вносит вклад в окончательный результат. К таким методам относится, например, сравнение по эталонам, различные способы анализа главных компонент по блокам изображений.

В третьей группе учитывается топологическое искажения изображения, рис. 1.5. Методы, использующие искажение изображения для сравнения, позволяют добиться лучших результатов.


Рис. 1.5 Пример искажения решётки исходного изображения


В методе сравнения эластичных графов на изображение накладывается набор ключевых точек, связанных между собой дугами. На неизвестном изображении находятся точки, соответствующие исходным и затем измеряется суммарное изменение размеров дуг. В гибких контурных моделях извлекается контур очертаний лица, и затем сравниваются формы контуров для разных изображений. Работа использует нейронные сети и скрытые Марковские модели для анализа соотношений расстояний между областями глаз, носа и рта.

В вышеописанных методах после нахождения ключевых областей или контуров остальная информация не учитывается, что снижает точность. Следующие методы сравнивают всё изображение.

Сначала вычисляется оптический поток между двумя сравниваемыми изображениями. Затем на основе оптического потока вычисляется мера искажения от неизвестного изображения к исходному. По величине этого искажения определяется степень похожести изображений. Работа использует генетический алгоритм для искажения неизвестного изображения в сторону сравниваемых, степень похожести изображений так же определяется величиной искажения. В данном случае используются эластичные деформации для сопоставления двух изображений целиком, рис. 1.6.

Пиксел отмеченный квадратом сдвигается в позицию пиксела отмеченного окружностью, три результата с различными праметрами деформации.


Рис. 1.6 Эластичные деформации: исходное изображение (слева)


Вышеприведённые методы сравнивают только суммарное искажение, не пытаясь учесть его характер, и в этом заключается их недостаток. Характер искажения изображения несёт важную информацию для распознавания изображения, и поэтому нижеприводимые методы имеют лучшую точность распознавания.

К таким методам относятся псевдодвумерные скрытые Марковские модели, свёрточные нейронные сети, когнитроны и неокогнитроны. Потенциальные поля, получаемые по искажениям изображения, используются для распознавания эмоций. В алгоритмах технологии FaceItâ корпорации Visionics изображение разбивается на блоки и анализируется взаимное расположение таких блоков. Эти методы для сравнения используют как характеристики участков (блоков) изображений (набор яркостей пикселей, коэффициентов частотных преобразований, главные компоненты блоков изображения и т.п.), так и взаимное расположение таких участков. Причём как характер искажений, так и содержимое участков усваивается в процессе обучения. В процессе распознавания искажение производится не к каждому примеру тренировочного набора, а к обобщённой модели класса.

По характеру использования обучающего набора методы распознавания лиц можно разделить на два больших класса. В методах первого класса в процессе настройки не используют обучающие примеры. В таких методах все параметры задаются вручную и, как правило, подбираются путём различных экспериментов. Например, криминалистическая идентификация человека по лицу с применением ключевых точек. В этой работе приведены результаты экспериментального выбора ключевых точек и отношений между ними, наиболее пригодных для задачи распознавания. Такой подход трудоёмок, требует априорных знаний о предметной области (в данном случае об антропометрических характеристиках лица) и большого количества настроечных экспериментов.

В противоположность этому второй класс методов в различной степени для извлечения признаков использует анализ обучающей выборки, представляющей собой набор типичных объектов нужных классов. Поэтому такие методы вычислительно более трудоёмки и их развитие стало возможным с возрастанием мощи вычислительной техники. Это метод главных компонент, линейные дискриминантные методы, метод сравнения эластичных графов. Однако в них основной упор сделан на автоматизированное извлечение признаков, но не отношений между ними и определения их важности (взвешивание). В работе предпринята попытка вычислить весовые параметры для эластичного сравнения графов. Линейный дискриминантный анализ используется для анализа признаков и преобразования их такому виду, чтобы они максимизировали межклассовые и минимизировали внутриклассовые различия.

Одни из самых совершенных методов, в которых извлечение признаков и построение системы их взаимоотношений происходит в процессе обучения - это скрытые Марковские модели и нейронные сети.

Для нейронных сетей на данный момент времени разработаны эффективные комбинированные методы обучения, которые позволяют полностью автоматизировать процесс выбора параметров архитектуры и обучение сети. При этом достигается результаты, превосходящие другие методы. Но вычислительно эти методы трудоёмки.

Методы распознавания по изображению лица можно разделить на три класса.

Первый класс использует исходное изображение только для начального выделения каких-либо ключевых точек, расстояний между такими точками, соотношения расстояний или других геометрических характеристик и в дальнейшем к исходному изображению (например, полутоновому) не обращается. Такая информация достаточно достоверно характеризует конкретного человека, и используется в криминалистике для опознания людей. Однако показано, что в целом геометрической информации недостаточно для распознавания человека по изображению лица.

Второй класс методов использует всё исходное изображение. Например, метод анализа главных компонент, линейный дискриминантный анализ оперируют исходным полутоновым изображением как многомерным вектором. К этому классу так же относятся различные нейронные сети, принимающие на вход изображение целиком. Многие источники сходятся во мнении, что для общих случаев распознавания требуется анализировать всю информацию, предоставленную на изображении (например, всё полутоновое изображение).

Третий класс представляет собой сочетание двух предыдущих. Здесь используются как геометрические характеристики, так и элементы, например, полутонового изображения. Например, метод сравнения эластичных графов. Вершины графа характеризуют некоторые особые точки изображения, дуги - расстояния между этими точками, кроме этого каждой вершине приписан набор локальных характеристик изображения (джет). Другим примером является метод сравнения эталонов. На изображении лица выделяются особые области, такие как глаза, нос, рот, и изображение сравнивается по этим областям.

Методы распознавания характеризуются так же различным соотношением в них аналитических и эмпирических способов решения задачи распознавания. Метод главных компонент и линейные дискриминанты, например, основаны на решении систем матричных уравнений и нахождений расстояний между образами в различных метриках. В методе сравнения эластичных графов ключевые точки отмечаются на обучающем наборе изображений лиц исходя из эмпирических соображений.

Особое место занимают нейросетевые методы. В процессе настройки сети используются аналитические методы градиентного спуска. Но такая настройка не дает, ни гарантии достижения минимума ошибки, ни оценки отклонения полученной ошибки от оптимальной. В отличие от статистических методов, решения, получаемые при помощи НС, носят не вероятностный, а правдоподобный характер, определяемый обучающим набором.

Похожая ситуация со скрытыми Марковскими моделями. Настройка параметров каждой модели осуществляется математическими оптимизационными методами, но они не дают точного решения.

Методы делятся на два класса по способу сравнения неизвестного изображения с тренировочным набором (или базой изображений).

Первый класс методов использует тренировочный набор для построения обобщённой модели каждого класса лица (или всех классов сразу). Это различные нейронные сети, линейные дискриминанты, скрытые Марковские модели.

Второй класс методов непосредственно сравнивает неизвестное изображение с каждым изображением из тренировочной выборки. Это метод собственных лиц (метод главных компонент), сравнение эталонов, методы сравнения эластичных графов, анализ оптического потока.

Использование последовательности кадров для задач, связанных с анализом изображения лица является более предпочтительным (но не всегда возможным), чем использование единичного статичного изображения, поскольку даёт дополнительную информацию.

Во-первых, это позволяет выбрать наиболее репрезентативные кадры из последовательности. Во-вторых, обучение системы на динамично меняющемся изображении позволяет ей извлечь больше информации об объекте.

Так, использование нескольких кадров значительно достоверность анализа выражения человеческого лица, позволяет проследить динамику его изменений при различных эмоциях. В работе при относительно простом алгоритме распознавания, использовалась последовательность кадров, поступающих с камеры, и при этом точность распознавания составила 90%.

Для поиска на изображении участка, соответствующего лицу, используются различные способы, важной частью которых являются методы определения того, содержит ли подаваемое на вход изображение лицо (детектирование).

Ряд методов изначально обладает способностями определения, относится ли входное изображение к классу «своих» изображений, и при соответствующей адаптации могут использоваться в качестве детекторов.

Различные типы нейронных сетей обладают способностью относить входное изображение к нужному классу с различной степенью доверия. Существуют подходы с использованием специально обученных нейронных сетей для того, чтобы определить содержит ли изображение лицо.

Метод анализа главных компонент так же применяется для детектирования области лица. На основе сравнения входного и реконструированного изображения можно определить, относится ли входное изображение к классу лиц.

Некоторые методы изначально обладают возможностью определения ракурса лица на изображении.

В работе на основе гибких контурных моделей лица были получены главные компоненты, отражающие углы пространственных поворотов лица.

В методах, использующих обучение, такие способности достигаются в процессе обучения. В работах при использовании метода главных компонент, были обнаружены компоненты, отражающие в основном эмоции, пол и расу.

В других методах возможность определения на основе изображения лица такие характеристики личности как пол, раса, возраст, эмоциональное состояние достигается в процессе обучения.

Нейронные сети использовались в работе для определения пола и эмоционального состояния. В нейронной сети имелся набор выходов, отвечающих за эти характеристики, и нейронная сеть обучалась классифицировать изображения лиц по этим признакам. [1]


.3Существующие программные средства


.3.1 Emgu CV

Emgu CV - кроссплатформенная «обёртка» для .NET библиотеки обработки изображений OpenCV (основной библиотеки), Emgu CV также называют библиотекой машинного зрения. Она используется для решения разнообразных задач связанных с 2D графикой, распознанием лиц и предметов на фото, распознание лиц и предметов на видео и др. Emgu CV может быть использован на нескольких различных языках, включая C #, VB.NET, C + + и IronPython.CV полностью написан на C #. Преимущество в том, что он может работать на любой платформе: Linux, Mac OS X, IOS и Android. Код является кросс-платформенным. [5]


1.3.2 AForge.NET

AForge.NET является основой C # и предназначен для разработчиков и исследователей в области компьютерного зрения и искусственного интеллекта - обработка изображений, нейронные сети, машинное обучение, робототехника и т.д..NET является основой для научных вычислений .NET. Структура основывается на AForge.NET, предназначена для обработки изображений, используются новые инструменты и библиотеки. Эти библиотеки охватывают широкий спектр научных вычислительных приложений, таких как статистическая обработка данных, машинное обучение, распознавание образов. Структура предлагает большое количество вероятностных распределений, проверки гипотез и поддержку для большинства популярных методов измерения производительности.[6]


1.3.3 Cognitec FaceVACS SDK и FaceVACS VideoScan

Новое поколение компьютерного видеонаблюдения автоматически сканирует входящий видеопоток, обнаруживает несколько лиц и проверяет наличие возможных совпадений в «контрольном списке». Если соответствие найдено, операторы получают уведомления в реальном времени.

Особенности:

слежение в реальном времени на нескольких видеопотоках;

в режиме реального времени лицо сравнивается с эталонами «контрольного списка»;

регистрации при неподвижном изображении или при живом потоке видео в ручном и автоматическом режиме;

применение С++ API и Web Services API;

возможность масштабируемости в пределах «контрольного списка»: размер, количество видеопотоков и число видимых лиц на изображении.

Возможности программ Cognitec:

чрезвычайно высокая обработка сравнений по образцам (900 000 сравнений в базе за секунду на среднем по силе процессоре);

интеграция с веб-камерами, http - камерами, цифровыми фотоаппаратами, видеокамерами, а также поддержка изображений в распространенных форматах;

объемные базы данных, интеграция с Oracle, IBM DB2, MSSQL Server.

Недостатки:

свет играет большую роль - к примеру, изображение лица в тени компоненты не распознают.

Помимо Web-приложений, Cognitec предоставляет API для цифровых рекламных щитов - билбордов (billboard) с целью показа рекламы для целевых аудиторий.участвует и в машиностроении, системы данной компании применяются в автомобилях для анализа лиц водителей и попутчиков, а также безопасности, например, путем выявления позиции головы, обнаружения рассеяного взгляда, обнаружения закрытых глаз. [7]


1.3.4 Visage Technologies Face Track

В зависимости от конфигурации, Visage Technologies Face Track может отслеживать контур рта, подбородка, контуры бровей, вращение и закрытие глаз. Полностью автоматический режим работы (ручная настройка доступна для повышения точности; результаты такой настройки могут быть сохранены и использованы повторно).

Распознает и отслеживает объекты, например, человека, даже когда он повернут спиной или боком. Автоматически повторно производит распознание, если новый человек появляется перед камерой. Поддерживает видео с веб-камеры или файлы AVI. Удобный интерфейс и отлаженная работа программы позволяет отслеживать изображения от любого источника видеосигнала.

Особенности:

минимальный размер изображения лица ок. 80 пикселей;

минимальное разрешение видео вход ок. 320 × 240. Более высокое разрешение (например, 640 × 480, 800 × 600) дает лучшие результаты;

отслеживает объект при вращении до 45 градусов;

обширный объем отслеживания и скорость (30 кадров в секунду в режиме реального времени);

Face Track возвращает полноценное изображение 3D объекта в данный момент времени, координаты лица и другую информацию.[8]


1.3.5 Kinect Face Tracking (Microsoft)

Face Tracking полностью реализуется программно, на основании данных получаемых из видеопотока (color stream) и потока данных дальномера (depth stream). Поэтому от ресурсов клиентского компьютера будет зависеть то, как быстро будет работать трекинг.

Стоит отметить, что трекинг лица (face tracking) это не то же самое что распознавание лиц (face recognition). Трекинг лица - это слежение за лицом человека в кадре с построением 87-ми узловой схемы лица.

Есть возможность следить за несколькими лицами.


Рис. 1.7 87-ми узловая схема лица


Помимо этих 87 узлов, вы можете получить координаты еще для 13: центры глаз, носа, уголки губ и границы головы. Face Tracking может построить 3D маску лица, как показано на следующем рисунке:


Рис. 1.8 3D маска лица


В задачи комплекса входит инициализация обработчика (engine) трекинга и слежение за перемещениями человека в кадре. Перегруженный метод Track, позволяет осуществлять поиск человека по данным с видеокамеры и дальномера.

Качество нахождения лица в кадре зависит как от расстояния до головы, так и от её положения (наклонов). Приемлемыми наклонами головы для сенсора считаются вверх-вниз ±20°, влево-вправо ±45°, наклон на бок ±45°. Оптимальными будут ±10°, ±30° и ±45° для наклонов вверх-вниз, влево-вправо и набок соответственно.

Минимальные требования к аппаратному обеспечению:

компьютер с двухъядерным (2,66-ГГц или больше) процессором;

Windows 7 или Windows 8 - совместимая видеокарта, которая поддерживает Microsoft ® DirectX ® 9.0;

- 2 Гб оперативной памяти. [9]


1.3.6 Microsoft Research Face SDK

Microsoft Research Face SDK включает новейшие технологий от исследовательских групп Microsoft. Microsoft Research Face SDK использует современные алгоритмы обработки изображений лица: распознавание, выравнивание, отслеживание и создание мультиплицированных образов.

Основными функциями являются: обнаружение, выравнивание, отслеживание. Учитывая особенности изображения, этот модуль отслеживания пытается найти все лица и возвращает список прямоугольников с указанием позиции (координат) лица. Алгоритм обнаружения автоматически обрабатывает изменения освещения, а также учитывает различные повороты объекта.

Модуль выравнивания пытается найти компоненты лица (глаза, брови, рот, нос и т.д.) и возвращает очертания компонентов.


Рис. 1.9 Очертания компонентов лица


Модуль отслеживания находит положения лица в режиме реального времени.[10]


1.3.7 Intel Perceptual Computing SDK

Компания Intel выпускает новый продукт Intel® Perceptual Computing SDK 2013 призванный помочь разработчикам приложений расширить возможности взаимодействия с конечным пользователем.

В первой версии продукта уже доступны простые интерфейсы для поддержки:

распознавание лиц;

распознавание жестов;

свободный трекинг пальцев и рук пользователя;

трекинг безмаркерных объектов;

распознования речи в режиме команд и надиктовывания коротких фраз.[11]


1.3.8 VeriLook Surveillance SDK

Комплект VeriLook Surveillance SDK адресован разработчикам биометрического программного обеспечения, реализующего распознавание пользователей по изображениям их лиц, используя видео потоки, полученные с цифровых видеокамер высокого разрешения в режиме реального времени. Этот комплект основан на VeriLook технологии распознавании пользователей по изображениям их лиц и используется для так называемой пассивной идентификации - то есть, когда проходящие люди не прилагают никаких усилий для их распознавания. К сферам использования данного продукта относятся: правоохранительные органы, охрана, контроль доступа, контроль посетителей, и др. С помощью этого комплекта обеспечивается быстрое создание прикладных биометрических решений на базе платформ Microsoft Windows и Linux.

Особенности:

регистрация (обнаружение) лиц в режиме реального времени, извлечение шаблона и сравнение его с базой данных;

одновременное отслеживание лиц нескольких человек при помощи видео в режиме реального времени;

автоматический режим работы позволяет регистрировать и создавать отчет о появлении, сравнении и исчезновение лица человека, а также вводить лицо нового пользователя в БД и добавлять его в список для наблюдения автоматически;

разработка приложений и систем идентификации по изображению лица возможна на базе различных платформ, поддерживаются несколько языков программирования;

поддержка нескольких камер.

Все характеристики даны для ПК с процессором IntelCore2 (4 ядра), 2,66 ГГц и одной камеры, подключенной к ПК.


Таблица 1.2 Технические характеристики алгоритма VeriLook

Технические характеристики алгоритма VeriLook Surveillance SDK, версия 1.1.Минимальный размер входящего изображения640 х 480 пикселейМинимальный размер лица для распознавания40 пикселей между глазамиКадров в секунду при кол-ве лиц = 3не менее 10Время для сравнения с шаблоном БДменее 1 сек.*Максимальный размер БДкол-во ограничено размером свободной оперативной памяти* до 50 000 записей в БД; при большем размере БД уменьшается быстродействие.


Системные требования

процессор IntelCore2 и выше (4 ядра), 2,66 Ггц или аналогичный другого производителя;

минимум 1 Гб свободной оперативной памяти ;

цифровая камера: разрешение камеры может варьироваться в зависимости от приложения от 0.3 мегапикселя (640 х 480 пикселей) до 1 мегапикселя и более. Высокое разрешение камер требует больше свободной оперативной памяти и уменьшает кол-во кадров в секунду.[12]


1.3.9 Signal Processing Toolbox

Signal Processing Toolbox - это пакет расширения MATLAB, содержащий набор типовых функций для цифровой и аналоговой обработки сигналов. Пакет включает графический пользовательский интерфейс для интерактивной работы и огромное количество функций командной строки для разработки новых алгоритмов.

Большая часть всех алгоритмов и функций, включенных в состав пакета, написана на языке MATLAB и открыта для чтения и редактирования. Типовые функции пакета могут использоваться для разработки различных алгоритмов анализа речи, обработки звука, проводных и беспроводных систем связи, финансового анализа, рентгенографии и медицинского приборостроения.


Рис. 1.10 Окно Signal Processing Toolbox


Ключевые возможности:

наборы моделей линейных систем и сигналов;

инструменты для разработки анализа и внедрения КИХ и БИХ фильтров;

проектирование аналоговых фильтров;

быстрое преобразование Фурье и дискретное косинусное преобразование;

спектральный анализ и статистическая обработка сигналов;

функции параметрического моделирования временных рядов;

генерация сигналов: чирп-импульс, Гауссовский импульс, последовательности импульсов заданной формы и длительности;

средства работы с оконными функциями;

графический пользовательский интерфейс для анализа и визуализации сигналов и фильтров.[13]


1.3.10 Wavelet Toolbox

Wavelet Toolbox - это пакет расширения MATLAB для работы с вейвлетами. Содержит функции вейвлет-преобразования, средства разработки вейвлет-алгоритмов, функции анализа, синтеза, фильтрации, сжатия и обработки, а также инструменты для кратномасштабного анализа одномерных и двухмерных данных.


Рис. 1.11 Окно Wavelet Toolbox


Wavelet Toolbox включает интерактивные графические средства для экспериментов с различными вейвлетами в задачах обработки и анализа данных. Пакет содержит функции разработки методов шифрования, сжатия и реконструкции, идентификации и анализа локальных и нестационарных процессов, а также обработки сигналов различной природы. Вейвлеты позволяют выявить те свойства, которые сложно обнаружить классическими частотными методами.

Ключевые возможности:

семейство классических вейвлетов: Добеши, комплексные вейвлеты Гаусса и Морлета, дискретный Мейера (фильтры Добеши, комплексные вейвлеты Гаусса и Морлета, биортогональные, дискретные вейвлеты Мейера);

-средства для обработки сигналов вейвлет-методами, преобразование частоты в масштаб и обратное (средства обработки сигналов и вейвлет-анализа, включая функции перевода сигнала из временной области в частотную);

методы построения семейства вейвлетов;

средства визуализации вейвлетов;

интерактивные средства для непрерывного и дискретного вейвлет анализа;

работа с вейвлет-пакетами как с MATLAB-объектами;

анализ по одной координате, сжатие и устранение шума сигнала;

анализ основных компонентов с использованием масштаба;

многопараметрическая фильтрация.[13]


1.3.11 OpenCV

OpenCV библиотека машинного зрения с открытым исходным кодом. Библиотека написана на C и C++ и работает под Linux, Windows и Mac OS X. OpenCV была разработана для эффективных вычислений и с упором на приложения реального времени. OpenCV написана на оптимизированном C и использует преимущества многоядерных процессоров.

Главной целью OpenCV является предоставление простой в использовании инфраструктуры компьютерного зрения, которая помогает быстро строить достаточно сложные приложения. OpenCV содержит более 500 функций, которые охватывают многие области, в том числе мониторинг конвейерной продукции, медицинская визуализация, безопасность, пользовательские интерфейсы, калибровка камер, стерео зрение и робототехника. Поскольку компьютерное зрение и машинное обучение, часто идут рука об руку, OpenCV также содержит комплексную библиотеку машинного обучения общего назначения Machine Learning Library (MLL). Эта подсистема ориентирована на статистическое распознавание образов и кластеризацию. Библиотека MLL весьма полезна для задач машинного зрения, но при этом носит достаточно общий характер и может использоваться для любых задач машинного обучения.

С момента своего альфа-релиза в январе 1999 года библиотека OpenCV использовалась во многих приложениях, продуктах и исследованиях. Такие приложения как "сшивка" изображений в спутниковых системах и веб-картах, выравнивание изображений, снижение шума в медицинских изображениях, анализ объектов, системы обнаружения вторжений, автоматический контроль, системы безопасности, производство систем контроля, калибровка камер, широкое военное применение, беспилотные летательные, наземные и подводные аппараты.

Возможности OpenCV:

человеко-машиное взаимодействие;

идентификация объектов;

сегментация и распознавание;

распознавание лиц;

распознавание жестов;

трекинг движения;

структура движения;

калибровка стерео-камер;

3D трекинг.[14]


1.4 Вывод по разделу


В этом разделе были рассмотрены основные методы и алгоритмы распознавания лиц и объектов в видеопотоке и указаны их основные достоинства и недостатки. Рассмотрены основные методы выделения движущихся объектов. Произведен их сравнительный анализ и проверено, что все они достаточно быстрые, чтобы использоваться в системах реального времени, а также их несложно реализовать и встроить в уже существующие проекты.

Подведем основные итоги:

)Существует довольно большое количество научных исследований, посвященных задаче распознавания и отслеживания объектов, однако почти все они зарубежные. В России наработок очень мало;

2)Алгоритмы ориентированы на конкретные задачи, несколько отличающиеся от поставленной задачи данной дипломной работы;

)Существует множество коммерческих разработок, ориентированных на определенные задачи распознавания:

-распознавание лиц - биометрия (могут быть интегрированы с оборудованием в целый комплекс);

-распознавание движущихся объектов - (пакет Matlab);

распознавание движущихся объектов применительно к задаче видеонаблюдения, как правило, сразу ориентированы на конкретное видеооборудование или интегрированы с ними.

4)Существуют программные средства разработки (SDK) для встраивания в собственные продукты. Многие из них представляют интерес с точки зрения проектирования комплекса, которому посвящена настоящая дипломная работа.

Характерный поток данных может быть представлен следующим образом:

1)Удлиненная последовательность данных разделена на отдельные сцены или кадры, подлежащие анализу. Так как они имеют различные гистограммы или цветные частотные распределения, кадр с радикальным изменением гистограммы от первоначального кадра может обрабатываться как изменение сцены.

)Изменение информационной части изображений обнаруживается отдельно от статического фона.

3)Отдельные информационные части изображений (объекты) выделяются или сегментируются, затем отслеживаются от кадра к кадру. Отслеживание включает обнаружение положения и скорость объекта, которые могут быть переменными или временно постоянными

)Если требуется распознавание, особенности объекта выделяются так, чтобы объект мог быть классифицирован.

Отслеживание объектов переднего плана включает в себя 3 этапа:

1)предсказание, при котором каждый объект должен быть расположен в текущем кадре;

)определение объекта, наилучшим образом соответствующего описанию;

3)коррекцию траектории объекта для предсказания очередного кадра.

Таким образом, выбор условий съемки и настроек очень важны для многих алгоритмов. Отлично работая в одних условиях, многие алгоритмы могут полностью перестать работать в других условиях.


Глава 2. Разработка алгоритмического обеспечения


.1 Архитектура средств динамического отслеживания лиц в видеопоследовательности


Рассматривается архитектура средств распознавания и динамического отслеживания лиц в видеопоследовательности (рис. 2.1). В блоке формирования графов лица на основе алгоритмов захвата и отслеживания области интересов создается граф лица. Сюда также включены алгоритмы

захвата и отслеживания простых объектов (квадрат, прямоугольник, окружность) в кадре и алгоритмы распознавания человека, использующиеся в блоке распознавания сцены. На этапе обучения системы полученный граф лица поступает на вход блока обучения. Далее ряд настроечных параметров системы сохраняются в базе признаков лиц. На этапе распознавания, граф лица, сформированный блоком формирования графов лица, обрабатывается в блоке распознавания лица. В этом блоке осуществляется распознавание лиц из базы данных. Если распознавание закончилось успешно, то блок принятия решений выдает управляющее воздействие, в зависимости от типа распознанного лица. В блоке распознавания сцены проводится распознавание сцен s-го уровня. Для того чтобы провести распознавание сцен первого уровня, блок получает результаты распознавания объектов сцены из блока распознавания лиц и блока формирования графов лица. Результаты работы блока распознавания сцены могут влиять на принимаемое решение об управляющем воздействии. В блоке хранения истории управления сохраняется последовательность распознанных лиц и соответствующих им управляющих воздействий за определенное время, в частности, с целью интерпретации принятых решений по управлению. Все сцены и лица, распознанные ранее этого периода, утрачиваются. [15]


Рис. 2.1 Архитектура системы распознавания лиц


2.2 Выбор базовых программных средств


В ходе выполнения дипломной работы были изучены различные подходы к распознаванию лиц (идентификации) и отслеживанию лиц в видеопоследовательности и произведено сопоставление результатов работы различных методов и программных продуктов, предоставляющих разработчику встраивать возможности распознавания лиц в собственное ПО. Также были изучены требования стандартов в области биометрии и ограничения существующих алгоритмов распознавания лиц. Работы проводились на базе ФГУП НИИ «Квант».

Были проанализированы результаты Face Recognition Vendor Test (FRVT) 2010 ? всестороннего теста коммерческих средств распознавания лиц, проводимого Национальным институтом стандартизации США. Данный тест в настоящее время не имеет аналогов по количеству исследуемых характеристик и по развитию научно-методологической базы, лежащей в его основе, а также по объемам использовавшихся тестовых выборок. В тестировании в том числе участвовало и показало высокие результаты ПО Cognitec FaceVACS, на базе которого ФГУП «НИИ «Квант» были построены программные средства распознавания и отслеживания лиц в видеопотоке. ПО Cognitec FaceVACS способно обеспечить отслеживание и распознавание лиц в видеопоследовательностях в реальном времени.

Для свободно распространяимых средств, таких, например, как OpenCV, исследования показали их недостаточную точность при работе с большой выборкой лиц и сложными условиями регистрации лица.


2.3 Разработка алгоритмов и методов динамического отслеживания лиц


На рис. 2.2 приведена общая схема алгоритма функционирования системы динамического отслеживания лиц. На первом этапе выполняют подготовку галереи известных персон. Данная галерея содержит лица людей, которые должны быть известны системе. Каждое изображение человека из галереи преобразуют в специальное представление, соответствующее методам распознавания, реализованным в системе. Такими представлениями могут быть, например, вектор главных компонент, построенных по изображению лица, граф, в вершинах которого находятся особенные точки лица (уголки глаз и рта, крылья и кончик носа и т.п.). К выбранному представлению затем преобразовывают каждое входное изображение перед проведением классификации. На следующем этапе выполняют обнаружение лица на изображении, представляющем одного из людей, находящихся в галерее. Для этого может быть использован любой алгоритм детектирования лица. В самом простом случае координаты лица могут быть заданы пользователем. Далее осуществляют сегментацию обнаруженного региона, после чего выполняют его предобработку. В общем случае данный этап включает в себя нормализацию, масштабирование региона, выравнивание его, например, в соответствии с положением глаз и т.п. Целью предобработки является уменьшения влияния условий съемки (например, освещения), в которых были получены анализируемые изображения, а также ракурса и ориентации представленных лиц на качество распознавания. Последние этапы выполняют для каждого изображения, формирующего обучающую выборку. Следующий блок осуществляет аналогичные действия по обнаружению, сегментации и предобработке для изображений, содержащих лица людей, которые никогда не будут проверяться системой. Подобное множество можно построить, например, путем искусственной генерации изображения лица из двух или более лиц реальных людей. Для получения количественной оценки степени похожести тестового и известного лица используется мера схожести, оперирующая выбранным представлением изображения лица.

На следующем этапе выполняется построение конечного правила распознавания. В общем случае для повышения устойчивости в системе классификации могут быть реализованы несколько мер схожести. После этого этапа система распознавания является настроенной и готова к обработке тестовых изображений. В режиме функционирования на вход системы поступает изображение, содержащее лицо человека, которого необходимо распознать. В этом случае задачей системы является проведение идентификации лица на входном изображении, т.е. определение, принадлежит ли оно кому-либо из галереи известных персон, и если да, то кому именно. Для этого выполняется серия сравнений входного лица с каждым лицом из галереи и принимается решение, к какому из них оно ближе в соответствии с построенным правилом распознавания. Кроме тестового, на вход также может быть подано второе изображение, тогда задачей системы является оценить похожесть двух лиц, т.е. принадлежат ли они одному и тому же человеку. Для этих целей система выполняет аналогичные действия по обнаружению, сегментации и предобработке тестового изображения и, если необходимо, второго входного изображения. После чего проводит классификацию при помощи построенного ранее правила распознавания.









Рис.2.2 Алгоритм динамического отслеживания лиц


Далее начинается процесс динамического распознавания лиц на данном видеофрагменте, который предварительно разделяется на последовательность кадров. Сначала происходит распознавание лица на первом кадре. На последующем кадре поиск лица начинается с его позиции на предыдущем кадре и поиска окрестности. Далее выбирается положение (часть кадра), максимизирующее сходство двух кадров. И все повторяется для последующих кадров.[16]


Глава 3. Экспериментальные результаты


.1 Результаты функционального тестирования


Разрабатываемый макет программных средств распознавания лиц был построен на инструментальных средствах компании Cognitec (Cognitec FaceVACS SDK 8.5). Ниже приведены результаты тестирования, проведенного в рамках Face Vendor Recognition Test (FRVT) 2010 на базах лиц большой размерности.


3.1.1 Описание тестовых баз лиц

LEO. База, собранная правоохранительными органами (Law EnfOrcement agencies и переданная в ФБР, также известна как FBI Photo File.)

DOS / Natural. База данных изображений с визовых документов нерезидентов. Используется для тестирования в рамках модели один-ко-многим.

DOS / HCINT. Выборка из DOS / Natural, использованная в рамках тестирования FRVT в 2002 и 2006 гг.

SANDIA. Набор фронтальных изображений лиц в высоком разрешении (цифровая фотокамера с матрицей 4 мегапикселя). Использовался в рамках тестирования FRVT 2006. Собрана Sandia National Laboratory. Подборка изображений была получена при контролируемом освещении с согласия субъектов. Проверочные изображения были подготовлены в двух режимах: при контролируемом и при случайном освещении.

Параметры изображений тестовых баз лиц приведены в таблице 3.1.



Таблица 3.1 Параметры изображений тестовых баз лиц, использовавшихся в FRVT 2010


Большинство изображений тестовых баз представлено изображениями низкого и среднего разрешения (кроме Sandia, см. выше) в формате сжатия JPEG. За исключением Sandia, расстояние между зрачками субъектов не контролировалось. Полученные изображения не соответствуют требованиям стандарта ISO на изображения для биометрии. Таким образом, большинство тестовых баз лиц предоставляют изображения, максимально приближенные к естественным условиям, что должно затруднить работу алгоритмов распознавания.

Размеры перечисленных баз изображений приведены в таблице 3.2.


Таблица 3.2 Размеры тестовых баз лиц, использовавшихся в FRVT 2010


Как видно из таблицы, большинство людей в базе представлены одним или двумя изображениями. Выборка в рамках теста FRVT 2010 производилась случайным образом по всем субъектам базы безотносительно количества представленных изображений.

На рисунке 3.1 приведен пример выборки из базы LEO.


Рис. 3.1 Выборка из базы лиц LEO


Изображение а) максимально приближено к стандартам для распознавания; на изображении b) лицо повернуто сразу по нескольким осям под углом, при котором алгоритмы распознавания обычно дают сбой, и к тому же пропорции изображения лица искажены слишком близким расстоянием съемки. Дополнительные проблемы создает неоднородное освещение и низкий контраст изображения; на изображении c) лицо не центрировано, несколько наклонено и небольшого размера по сравнению с размерами кадра, засвечено и имеет низкий контраст. Изображения b) и c) сняты с низким разрешением 240х240 (вебкамера). [17]


3.1.2 Результаты тестирования алгоритма идентификации лиц

На рисунке 3.2 приведен результат тестирования коммерческих средств на тестовых базах лиц LEO и DOS / Natural. Программные средства Cognitec показали точность 0,83 и 0,88 соответственно.


Рис. 3.2 Результаты сравнения точности распознавания лиц различными коммерческими средствами на тестовых базах лиц LEO и DOS / Natural. Программные средства Cognitec обозначены обозначены Х04, синий цвет графика


На рисунке 3.3 приведены примеры изображений лица при различных углах поворота, на рисунке 3.4 - результаты тестирования при различных углах поворота лиц.


Рис. 3.3 Изображение лица при углах поворота 0, 15, 22,5 и 45 градусов


На рисунке 3.4 программные средства фирмы Cognitec обозначены Х02 (синий график). Из сравнения графиков для различных коммерческих средств видно, что SDK фирмы Cognitec при нулевом угле поворота головы дает очень малое значение ошибки и находится на 2 месте по точности распознавания. В целом форма графика примерно одинакова для всех средств. Для Cognitec заметные ошибки распознавания начинаются при угле поворота от ±16 градусов, что соответствует требованиям стандартов по распознаванию (угол поворота головы не более 15 градусов). [18]


Рис. 3.4 Зависимость величины ошибки распознавания от угла поворота головы


3.1.3 Результаты тестирования алгоритма поиска лиц на изображениях

В данном разделе приведены результаты тестирования работы алгоритма поиска лиц на групповых изображения. Для тестирования были взяты несколько случайных изображений, найденных в интернете. Изображения содержат искажения: поворот головы в различных плоскостях, нефронтальная съемка, низкая контрастность или четкость. Изображения представлены в низком разрешении. Групповые фотографии были выбраны неслучайно, так как большое количество людей в кадре автоматически уменьшает возможный размер каждого лица и его детализацию. Кроме того, на групповых фотографиях можно одновременно зафиксировать различные углы поворота головы, а также перекрытие лиц.


Рис. 3.5 Групповая фотография с искаженным ракурсом


Параметры отслеживания лиц: минимальное расстояние между зрачками 0,01% кадра, максимальное 0,3%


Рис. 3.6 Групповая фотография низкого разрешения со многими искажениями


Тем не менее, все лица были определены верно.


Рис. 3.7 Увеличенный фрагмент фотографии


На рис. 3.7 видно низкое разрешение исходного изображения в сочетании с очень низкой контрастностью лиц, наличием на лицах артефактов


Рис.3.8 Групповая фотография низкого разрешения и низкой четкости


Фотография содержит множество лиц с очень маленьким расстоянием между зрачками. Все лица определены корректно. Параметры: минимальное расстояние между зрачками 0,005% кадра, максимальное 0,05%


3.1.4 Результаты тестирования. Отслеживание лиц в видеопоследовательности

В режиме отслеживания выполняется отслеживание и маркирование лиц в видеопотоке без их распознавания. Отслеживание производится как для крупного, так и для общего плана видео. Дополнительно компонент способен производить отслеживание лиц для статичного изображения, не зависимо от качества последнего. В обоих режимах доступны тонкие настройки параметров распознавания. При изменении значений оператором новые настройки начинают действовать немедленно. Настройки компонента содержат два параметра: минимальное (min) и максимальное (max) расстояние между зрачками. Эти параметры определяют разрешенный диапазон размеров лица относительно размера кадра. В результате исследования были эмпирически установлены следующие зависимости:

-для отслеживания максимально возможного количества лиц при очень маленьких размерах лиц (например, на групповом снимке или на кадре, где присутствует множество людей), рекомендуется устанавливать диапазон min..max в небольшие значения, например, 0,01..0,05, что соответствует 1 % и 5 %. При увеличении верхней границы возможны ошибки распознавания областей, не являющихся лицами, как лиц. При увеличении нижней границы будут потеряны лица, для которых расстояние между зрачками оказалось меньше допустимого;

-для отслеживания лиц на крупных планах рекомендуется устанавливать большие значения min..max (больше 30 % кадра, например, 0,1..0,4). При снижении границы min возможны ошибки распознавания мелких деталей кадра как лиц;

для смешанных планов min устанавливается небольшим, но не менее 1 %, max - как для крупных планов, например: 0,01..0,4. Приведенные значения являются оптимальными для большинства случаев, однако не гарантируют от появления ошибок распознавания.


3.1.5 Распознавание лиц в видеопоследовательности

Для успешной работы процедуры распознавания предварительно должно быть произведено обучение базы лиц на наборе портретов людей, которые должны в дальнейшем распознаваться на видео или статичных кадрах. Для обучения желательно использовать изображения, соответствующие биометрическому стандарту ISO 19794-5. Основные требования к обучающим изображениям:

-лицо фронтальное, без наклонов и поворотов (допускается отклонение до 5 градусов по каждой из трех геометрических осей);

-лицо снято при нормальной освещенности, то есть отсутствуют пересвеченные области и тени. Лицо должно быть освещено равномерно, не допускается наличие преимущественного направления освещения;

не допускается наличие бликов на изображении лица.

В настоящей работе, ввиду сложности получения соответствующих стандарту изображений интересующих лиц также проводилось обучение компонента на изображениях, полученных из сети Интернет, а также взятых напрямую из видеокадров, содержащих крупный план лица. Последний вариант интересен также с точки зрения организации полуавтоматического обучения компонента непосредственно при распознавании видеопотока.


3.2 Результаты тестирования на больших объемах видеоданных


На рисунке 3.9 четко видно, как программа находит и отслеживает несколько лиц в видеофрагменте на среднем плане трансляции, при различном удалении лиц от камеры, положение лица во фронтальной позиции. В данном случае настройками определено учитывать все планы трансляции.


Рис.3.9 Скриншот из видеофрагмента 1


На рисунке 3.10 также определено два лица на среднем плане трансляции, но лица не во фронтальной позиции, они повернуты и наклонены, несмотря на это определение лиц в кадре проходит успешно. Тем не менее, размеры лиц в кадре недостаточны, чтобы произвести их распознавание.


Рис.3.10 Скриншот из видеофрагмента 2


На рисунке 3.11 программа распознала лицо во фронтальной позиции на крупном плане трансляции, а так как данное лицо было включено в обучающую выборку, то также был определен конкретный человек, который может быть отслежен на последующих кадрах, т.е. после распознавания данное лицо было «запомнено» для дальнейшего отслеживания.


Рис.3.11 Скриншот из видеофрагмента 3


На рисунке 3.12 распознаны лица на среднем плане трансляции, лица людей наклонены и повернуты боком, распознавание проходит верно, несмотря на значительные искажения, вызванные наклоном и поворотом лиц. В данном случае величины наклонов и поворотов значительно превышают допустимые в биометрии значения.


Рис.3.12 Скриншот из видеофрагмента 4


На рисунке 3.13 выявлена группа лиц, однако не все лица распознаны, так как этого не позволяет сделать угол наклона лица, либо дальность нахождения от камеры.


Рис.3.13 Скриншот из видеофрагмента 5


На рисунке 3.14 найдены лишь лица во фронтальном положении, а вот человека, повернутого к нам спиной, программа распознать не смогла. Также слишком мелкие лица не были найдены.


Рис.3.14 Скриншот из видеофрагмента 6


На рисунке 3.15 найдены почти все лица, несмотря на очень сложные условия освещения. Не найдено лишь лицо человека, который отвернулся от камеры, так как, по сути, на изображении лица этого человека отсутствуют все характерные точки, по которым может производиться определение лица.


Рис.3.15 Скриншот из видеофрагмента 7


На рисунке 3.16 лица выявлены вне зависимости от цвета кожи. Кроме того, два лица на заднем плане определены с использованием лишь части характерных особенностей лица, так как остальные заслоняются спортсменом на переднем плане.


Рис.3.16 Скриншот из видеофрагмента 8


На рисунке 3.17 программа распознала лицо, а так как данное лицо было включено в обучающую выборку, то также был определен конкретный человек (стоит настройка «отображать подпись»), который может быть отслежен на последующих кадрах, т.е. после распознавание данное лицо было «запомнено» для дальнейшего отслеживания. Необходимо отметить, что для обучения были использованы фронтальные или почти фронтальные изображения лиц. На данном кадре лицо развернуто практически в профиль, что сильно затрудняет распознавание. Тем не менее, программа выдала корректный результат.


Рис.3.17 Скриншот из видеофрагмента 9


3.3 Выводы по разделу


У программы, построенной на разработанном алгоритме, есть определенные преимущества:

способность производить распознавание в реальном времени из заданного видеофайла или же из видеопотока с веб-камеры, в зависимости от произведенных настроек;

при достаточно большом масштабе лица во фронтальной позиции достигается полностью достоверное распознавание;

программа дает достаточно хорошие результаты даже в случае больших величин наклона и поворота лица (> 20 градусов) и при сложных условиях освещения. Требование - лицо не должно быть очень мелким;

программа способна отслеживать множественные лица, вплоть до очень мелких, в зависимости от настроек распознавания, т.е. при точной и грамотной настройке можно отследить даже лица группы людей, находящихся в достаточном удалении от камеры, хотя распознавание личности в данных условиях невозможно.


Глава 4. Организационно-экономическая часть


.1 Технико-экономическое обоснование объекта проектирования


Рис. 4.1 Дерево целей


В дипломном проекте разрабатывается алгоритмическое обеспечение комплекса программных средств для динамического отслеживания лиц на последовательностях кадров. Разрабатываемая система даст возможность распознавания человека, даже если он повернут спиной.

Роль и важность разработки данного алгоритма определяется постоянно возрастающей необходимостью распознавать человека по различным антропометрическим данным. Технология идентификации человека на основе изображений лиц признана наиболее приемлемой для массового применения, так как она не требует физического контакта с устройством, ненавязчива, естественна и, в потенциале, может обладать высокой надёжностью и скоростью. Существует множество аналогов данного алгоритма, но подавляющее большинство зарубежного производства.

Цели и задачи разработки алгоритма представлены в виде «дерева целей».


.2 Состав конструкторской группы и их должностные оклады


Для организации выполнения задачи разработки необходимо определить состав ИТР (инженерно-технических работников), участвующих в данном проекте.

В соответствии с требованиями ГОСТ для выполнения полного объема работ достаточно группы состоящей из двух человек:

) Ведущий инженер;

) Инженер-программист 1-й категории;


Таблица 4.1 Состав конструкторской группы и должностные оклады

Категория работающихКоличество человекДолжн. оклад руб./мес.Ведущий инженер127742,65Инженер-программист 1-ой категории126441,4ИТОГО:254184,05


Таблица 4.2 Перечень этапов для разработки алгоритма динамического отслеживания лиц

ЭтапыСодержание работ, входящих в этапВид отчётности по законченной работеКол-во исполнителей, чел.ДолжностьПродолжительность работы, дниРабота компьютера, дни1234567Техническое задание1. Постановка задачиЗапись в тетрадь1Ведущий инженер12. Сбор исходных материалов Обзор литературы1Инженер первой категории33. Определение структуры входных и выходных данных Обзор литературы и запись в тетрадь, работа на ПК1Инженер первой категории334. Выбор языков программированияОбзор литературы и запись в тетрадь1Инженер первой категории25. Согласование и утверждение технического заданияТехническое задание2Ведущий инженер2Инженер первой категории5Эскизный проект1. Предварительная разработка структуры входных и выходных данныхТехническое задание1Инженер первой категории32. Уточнение методов решения задачиОбзор литературы и запись в тетрадь, работа на ПК1Инженер первой категории433.Разработка общего описания алгоритма решения задачиОбзор литературы и запись в тетрадь, работа на ПК1Ведущий инженер134.Разработка технико-экономического обоснованияЭкономический отчет, работа на ПК1Инженер первой категории525. Разработка пояснительной записки Пояснительная записка2Ведущий инженер1Инженер первой категории36.Согласование и утверждение эскизного проектаЭскиз проекта2Ведущий инженер2Инженер первой категории4Технический проект1.Уточнение структуры входных и выходных данныхРабота на ПК, запись в тетрадь1Инженер первой категории232.Разработка алгоритма решения задачиРабота на ПК1Ведущий инженер243. Определение формы представления входных и выходных данныхРабота на ПК1Инженер первой категории434. Разработка плана мероприятий по разработке и внедрению программРабота на ПК, запись в тетрадь1Ведущий инженер235.Разработка пояснительной запискиПояснительная записка1Ведущий инженер36.Согласование и утверждение технического проектаКомплект технической документации, работа на ПК2Ведущий инженер23Инженер первой категории3Рабочий проект1.Программирование и отладка программыРабота на ПК1Инженер первой категории442.Разработка программных документов в соответствии с требованиями ГОСТ 19.101-77 <#"justify">Внедрение1.Подготовка и передача программы и программной документации для сопровождения и изготовленияДоклад о результатах работы, отчёт 1Инженер первой категории32.Оформление и утверждение акта о передаче программы на сопровождение и изготовлениеАкт приемки-сдачи1Ведущий инженер23.Передача программы в фонд алгоритмов и программДоклад о результатах работы, отчет1Ведущий инженер2ИТОГО:9040

4.3 Перечень работ, выполняемых в процессе разработки алгоритма динамического отслеживания лиц и программной документации


С учётом данных таблицы 4.1 составляется перечень этапов для разработки алгоритма динамического отслеживания лиц. Для определения общей продолжительности этапов необходимо учесть то, что на дипломное проектирование, учебным планом предусмотрено четыре месяца (приблизительно 90 рабочих дней).

Ведущий инженер занят в проекте 27 дней, инженер-программист занят - 63 дня.


4.4 Расчёт сметы затрат на разработку алгоритмического обеспечения комплекса программных средств для динамического отслеживания лиц


Смета затрат на разработку рассчитывается на основании данных, приведённых в таблицах 4.1 и 4.2 по следующим статьям затрат:

затраты на материалы, используемые для разработки алгоритма;

заработная плата (основная и дополнительная) инженерно-технических работников (ИТР);

Страховые взносы, исходя из следующих ставок:

пенсионный фонд - 22%;

фонд социального страхования - 2,9%;

фонд обязательного медицинского страхования - 5,1%;

прочие денежные расходы (100% от заработной платы разработчиков проекта);

Расходные материалы определяются исходя из объёма работ и фактических затрат. Данные по ценам на материалы формируются исходя из рыночных цен на текущий момент времени.


4.4.1 Смета затрат на основные и вспомогательные материалы


Таблица 4.3 Затраты на основные и вспомогательные материалы, используемые при работе

№ п/пНаименование материалаЕдиницы измеренияСтоимость единицы материала, руб.КоличествоОбщая стоимость материала, руб.Основные материалы1Бумага писчая А4Упаковка (500 лист.)250,001250,002Ватманлист24,006144,003Ручка шариковаяшт.10,00220,004Карандашшт.15,00230,005Линейкашт.13,00113,006Запоминающее USB- устройствошт.500,001500,007Папка для бумагшт.25,004100,008Скрепкиуп.12,00112,009Кнопкиуп.22,00122,0010Картридж для принтера HPшт.550,001550,0011Ластикшт.5,0015,0012Штрихшт.45,00290,00Итого за основные материалы1736,00Вспомогательные материалы (10% от основных материалов)173,6Итого за основные и вспомогательные материалы1909,6Транспортно-заготовительные расходы (5% от суммы расходов на основные и вспомогательные материалы)95,48Итого затраты на основные и вспомогательные материалы с учетом транспортных расходов2005,08

4.4.2 Расчет заработной платы инженерно-технических работников

Основная (тарифная) заработная плата рассчитывается как произведение дневной оплаты труда на количество дней, в течение которых разработчик занят на выполнении работ по разработке алгоритма. Количество рабочих дней в месяц принято равным 22-м дням. Количество дней работы каждого из исполнителей определяются из таблицы 4.2.

Тарифная заработная плата вычисляется по формуле:


(4.1.)


где: O - должностной оклад, руб./мес.;

- количество рабочих дней в месяц;

Т - трудоемкость по выполнению работ в этапах проекта, соответствует количеству дней затраченных одним работником при разработке проекта.

Основная (тарифная) заработная плата ведущего инженера равна:


(4.2.)


Тарифная заработная плата инженера-программиста 1-й категории равна:


(4.3.)


Все расчеты сведены в таблицу 4.4.


Таблица 4.4 Расчет заработной платы ИТР

№ДолжностьОклад, руб.Оплата, руб./деньПродолжительность работ, дниИТОГО, руб.1Ведущий инженер27742,65126127340472Инженер программист 1-ой категории26441,41201,96375719,7ИТОГО тарифная зарплата109766,74Доплаты к заработной плате(40 % от тарифной зарплаты)43906,65Основная заработная плата153673,36Дополнительная зарплата (20 % от основной)30734,67Сумма основной и дополнительной зарплаты184407,9

4.4.3 Расчёт страховых взносов

Страховые взносы рассчитываются как доля от суммы основной и дополнительной зарплаты. Расчет производится исходя из следующих ставок:

пенсионный фонд - 22%;

фонд социального страхования - 2,9%;

фонд обязательного медицинского страхования - 5,1%.

Сумма заработных плат равна 184407,9 руб. Результаты расчета представлены в таблице 4.5.


Таблица 4.5 Расчет страховых взносов

№Наименование фондаСтавка %Взнос руб.1.Пенсионный фонд2240569,72.Фонд социального страхования2,95347,83Фонд обязательного медицинского страхования5,19404,84ИТОГО страховых взносов:55322,3

4.4.4 Прочие денежные расходы

Величина прочих денежных расходов РПр рассчитывается в процентном отношении от суммы основной и дополнительной заработной платы и составляет 100% ее величины: РПр = 184407,9 руб.


4.4.5 Смета затрат

Общая смета затрат приведена в таблице 4.6.


Таблица 4.6 Смета затрат на разработку алгоритма

№Статья затратСумма руб.1Затраты на расходные материалы2005,082Основная заработная плата153673,33Дополнительная заработная плата30734,64Страховые взносы55322,35Прочие расходы184407,9ИТОГО426143,18

4.5 Вывод по разделу


В результате расчета затраты на разработку алгоритмического обеспечения комплекса программных средств для динамического отслеживания лиц определены в размере 426143,18 рублей. Главная цель разработки - это создание более совершенного алгоритма распознавания и отслеживания лиц. Данный алгоритм может быть использован в различного вида системах видеонаблюдения, а также применим для идентификации личности.


Глава 5. Безопасность и экологичность проектных решений


.1 Цель и решаемые задачи


Основным средством для разработки алгоритмического обеспечения комплекса программных средств является применение ПЭВМ, оснащенного ЖК-дисплеем, который является основным источником негативного воздействия на здоровье. Также при работе с ПЭВМ человек может подвергаться воздействию вредных и опасных факторов, к которым могут относиться электромагнитные поля, недостаточная освещенность, шум, статистическое электричество, малый объем движений, напряжение зрительного анализатора и др.

Целью данной главы является обеспечение нормальной работоспособности и снижение воздействия вредных факторов, для чего нужно выполнять все требования по обеспечению безопасности и условий труда, а также содержать в соответствующем состоянии окружающее рабочее пространство.

Следовательно, основным объектом анализа следует выбрать именно процесс и средства взаимодействия инженера с ПЭВМ, на эргономику рабочего места, а также следует обратить внимание на экологичность данной установки и факторы, воздействующие на окружающую среду, возникшие в процессе эксплуатации ПЭВМ, оргтехники, периферийный устройств находящихся в лаборатории.


5.2 Опасные и вредные факторы при работе с ПЭВМ


При работе с ПЭВМ могут возникнуть потенциально опасные и вредные факторы, воздействие которых на организм человека может принести ему вред и привести к травматизму. Основные факторы с местом их возникновения и нормами изложены в ГОСТ 12.1.003-74/80 и сведены в таблицу 5.1.


Таблица 5.1 Опасные факторы и их действие на организм человека

Наименование фактораДействия на организм человекаГипокинезияЗаболевания опорно-двигательного аппарата, ожирение, нервно-психическая перегрузка, формирование сердечно-сосудистой патологииМонотонность трудаНервно-психическая перегрузкаПовышенный уровень статического электричестваЭлектрический ударПовышенные уровни электромагнитного излучения.Утомляемость, изменение кровяного давления, замедление пульса, выпадение волос, ломкость ногтей, сердечно-сосудистые заболеванияПониженная или повышенная влажность воздуха рабочей зоны, пониженная или повышенная подвижность воздуха рабочей зоныПерегрев или переохлаждение организма, ОРЗ, ревматические заболевания, переохлаждение организма, ОРЗ, ревматические заболеванияПовышенный уровень шумаНарушение работы слухового аппарата, нервно-психическиеПовышенный или пониженный уровень освещенностиУхудшение зрения, травматизмПовышенный уровень блесткостиНеравномерность распределения яркости в поле зренияПовышенная яркость светового изображенияПовышенный уровень пульсации светового потокаПовышенное значение напряжения в электрической цепи, замыкание которой может произойти через тело человекаЭлектрический удар, электротравмаНапряжение внимания, интеллектуальные нагрузки, эмоциональные нагрузки, статистические нагрузки, нерациональная организация рабочего местаПереутомление, психические расстройства, заболевания опорно-двигательного аппарата.Повышение уровня вредных химических веществТоксическое и канцерогенное действие


5.3 Характеристика объекта исследования


Объектом исследования является лаборатория предприятия, оборудованная рабочими местами с ПЭВМ в количестве 4 шт., оснащенных ЖК-дисплеями. Тема дипломного проекта, решаемого на базе данного объекта, формализуется как «Разработка алгоритмического обеспечения комплекса программных средств» и осуществляется с помощью программных продуктов. Рабочее место оснащено ПЭВМ типа IBM PC - 1 шт., оснащенных ЖК-дисплеями, фирмы DEL Professional P2312H - 1 шт., мышь A4Tech Run On Shine X5-3D - 1 шт. и клавиатура Logitech - 1 шт. Исходя из того, что оператор основное количество времени проводит перед экраном дисплея, который является основным источником электромагнитного поля, оказывающего негативное влияние на организм человека, следует определить требования к дисплею, которые бы максимально снижали уровень его вредного влияния (СанПиН 2.2.2/2.4.1340-03):


Таблица 5.2 Допустимые визуальные параметры устройств отображения информации

NПараметрыДопустимые значения1Яркость белого поляНе менее 35 кд/кв.м2Неравномерность яркости рабочего поляНе более +-20%3Контрастность (для монохромного режима)Не менее 3:14Временная нестабильность изображения (непреднамеренное изменение во времени яркости изображения на экране дисплея)Не должна фиксироваться5Пространственная нестабильность изображения (непреднамеренные изменения положения фрагментов изображения на экране)Не более 2 х 10(-4L), где L - проектное расстояние наблюдения, мм

Используемые видеодисплеи полностью удовлетворяют нормам (в соответствии с техническим паспортом), а также их конструкция, дизайн и совокупность эргономических параметров обеспечивают надежное и комфортное считывание отображаемой информации в условиях эксплуатации, соответствующих СанПиН 2.2.2./2.4.1340-03[19].

Конструкция ВДТ обеспечивает возможность фронтального наблюдения экрана путем поворота корпуса в горизонтальной плоскости вокруг вертикальной оси в пределах ±60 градусов и в вертикальной плоскости вокруг горизонтальной оси в пределах ±35 градусов с фиксацией в заданном положении. Дизайн ВДТ должен предусматривает окраску корпуса в спокойные мягкие тона с диффузным рассеиванием света. Корпус ВДТ и ПЭВМ, клавиатура и другие блоки и устройства ПЭВМ имеют матовую поверхность одного цвета с коэффициентом отражения 0,45 и не имеют блестящих деталей, способных создавать блики. Клавиатура имеет опорное приспособление, позволяющее изменять угол наклона поверхности в пределах от 5 до 15 градусов.


5.4 Мероприятия по безопасности труда и сохранению работоспособности


.4.1 Обеспечение требований эргономики и технической эстетики

Планировка помещения и размещение оборудования

Планировка и размещение рабочих мест соответствует требованиям в соответствии с гигиеническими нормативами. [СанПиН 2.2.2./2.4.1340-03].

Удельная площадь, приходящаяся на одного человека, составляет:


(5.1)


Где - площадь помещения,

- площадь, занятая крупногабаритным оборудованием и мебелью,

- число человек, одновременно работающих в помещении.



Это значение соответствует нормам, указанным в СанПиН 2.2.2/2.4.1340-03 (не менее 4,5 м2).

Согласно Гигиеническим требованиям к персонально электронно-вычислительным машинам и организации работы, помещение оснащено естественным и искусственным освещением, соответствующее действующей нормативной документации, расстояния между столами с мониторами превышают значения 2 м и 1,2 м между боковыми поверхностями, высота стен 4 м.

Схема расположения ПЭВМ изображена на рисунке 5.1.


Рис. 5.1 Планировка и размещение рабочих мест


Эргономические решения по организации рабочего места пользователя ПЭВМ

Для сохранения работоспособности и предупреждения развития заболеваний опорно-двигательного аппарата необходимо организовать рабочие места в соответствии с требованиями ГОСТ 12.2.032-78.

Конструкция стола должна обеспечивать оптимальное размещение на рабочей поверхности используемого оборудования с учетом его количества и конструктивных особенностей и характера выполняемой работы.

На рабочем месте, помимо монитора и органов управления должна располагаться документация, могут вестись записи, использоваться другие технические средства, поэтому для того, чтобы не вызывать частой переаккомодации глаз, предметы постоянного пользования на рабочем месте оператора ПК и визуальные элементы информационной модели должны находиться примерно на одинаковом расстоянии от глаз.

Форму рабочей поверхности следует устанавливать с учетом характера выполняемой работы. Она может быть прямоугольной, иметь вырез для корпуса работающего, углубления или другие поверхности для средств оргтехники. Если требуется повышенная точность при работе и, соответственно, необходима фиксация положения корпуса и рук, в качестве дополнительной меры может использоваться мягкая обивка на переднем крае стола.

Высота рабочей поверхности стола для операторов, занимающихся в основном набором информации, должна регулироваться в пределах 680-800 мм; при отсутствии такой возможности высота рабочей поверхности стола в соответствии с антропометрическими характеристиками отечественного пользователя должна составлять 725 мм. При этом экран монитора должен быть расположен ниже уровня глаз на 28 см.

Модульными размерами рабочей поверхности стола для ПК, на основании которых должны рассчитываться конструктивные размеры, следует считать: ширину 800, 1000, 1200 и 1400 мм; глубину 800 и 1000 мм при нерегулируемой его высоте, равной 725 мм.

Как наиболее подходящий был выбран компьютерный стол GD-010.


Рис. 5.2 Конструкция стола


Рабочий стол должен иметь пространство для ног высотой не менее 600 мм, шириной не менее 500 мм, глубиной на уровне колен - не менее 450 мм и на уровне вытянутых ног - не менее 650 мм.

Рабочие кресло (стул) оператора ПК должно включать следующие основные элементы: сиденье, спинку и подлокотники. В качестве дополнительных элементов могут быть подголовник и подставка для ног. Подвижность кресла относительно пола или другой поверхности, на которой оно установлено не ограничивается.

Конструкция кресла должна обеспечивать поддержание физиологически рациональной рабочей позы при работе на ПК, позволять изменять позу с целью снижения статического напряжения мышц шейно-плечевой области и спины для предупреждения развития утомления.

Кресло должно быть подъемно-поворотным и регулируемым по высоте и углам наклона сиденья и спинки, а также расстоянию спинки от переднего края сиденья, при этом регулировка каждого параметра должна быть независимой, легко осуществляемой и иметь надежную фиксацию.

Конструкция его должна обеспечивать [СанПиН 2.2.2.542-96]:

регулировку высоты поверхности сиденья в пределах 400-550 мм (от 5 до 95 перцентиля) и углов наклона вперед до 15° и назад до 5°;

возможность вращения на 180°-360° (вокруг вертикальной оси опорной конструкции кресла с фиксацией в нужном положении);

ширину и глубину поверхности сиденья не менее 400 мм (рассчитывается для 95 перцентиля);

поверхность сиденья с закругленным передним краем, радиус скругления не менее 10 мм;

высоту опорной поверхности спинки 300±20 мм, ширину - не менее 380 мм и радиус кривизны горизонтальной плоскости - 400 мм;

угол наклона спинки в вертикальной плоскости в регулируемых пределах 95°-110°;

регулировку расстояния спинки от переднего края сиденья в пределах 260-400 мм;

стационарные или съемные подлокотники длиной не менее 250 мм и шириной 50-70 мм;

регулируемый угол наклона подлокотников 0°-20 (нерегулируемый -0°-5°);

регулировку подлокотников по высоте над сиденьем в пределах 230±30 мм и внутреннего расстояния между подлокотниками в пределах 350-500 мм (от 50 до 95 перцентиля).


Рис. 5.3 Конструкция стула


Поверхность сиденья, спинки и других элементов стула (кресла) должна быть полумягкой, с нескользящим, неэлектризующимся, влагоотталкивающим и воздухопроницаемым покрытием, обеспечивающим легкую очистку от загрязнения. Осадка обивки сиденья рабочих кресел должна находиться в пределах 25-30 мм. Кресла, предназначенные для длительного отдыха, могут иметь несколько бoльшую осадку - 30-40 мм. Поверхность сиденья может быть плоской, имеющей наклон 0°-5°, или профилированной. Профилировка создается двумя углами наклона поверхности сиденья - передним 4°-5°, и задним 10°-15°.

Рабочее место должно быть оборудовано подставкой для ног, имеющей ширину не менее 300 мм, глубину не менее 400 мм, регулировку по высоте в пределах до 150 мм и по углу наклона опорной поверхности подставки до 20°. Поверхность подставки должна быть рифленой и иметь по переднему краю бортик высотой 10 мм.

Клавиатура расположена на поверхности стола на расстоянии 100 - 300 мм от края, обращенного к пользователю, или на специальной, регулируемой по высоте рабочей поверхности подставке, отделенной от основной столешницы.


Рис. 5.4 Величина угла зрения


Из всего вышесказанного, делаю вывод, что мое рабочее место соответствует требованиям СанПиН 2.2.2./2.4.1340-03.

Цветовое оформление помещения

Выбор цветового решения производственных помещений произведен в соответствии с СН-181-70 . При выборе были учтены: характер работ, климатические и географические особенности района, освещенность, спектральный состав света, микроклимат помещения, особенность интерьера.

Потолок выполнен в белом цвете (коэффициент отражения 60 - 90 % в пределах нормы). С учётом того, что окна ориентированы на запад, для окраски стен используется краска светло-желтого цвета в ярко выраженных теплых тонах со средней величиной насыщенности. Учитывая светлую фактуру деревянных столов, шкафов и стульев, а также искусственное освещение, которое обеспечивается с помощью ламп дневного освещения, использована матовая консистенция для избегания бликов и преломлений света. Коэффициент отражения 50 %, что соответствует пределам для стен 50-60%. Насыщенность краски 0,5 %, чистота цвета 0,05.

Пол в помещении выполнен в виде паркета, поэтому воспользуемся полупрозрачным лаком светлого красно-оранжевого естественного оттенка, коэффициент отражения которого находится в пределах 30-40%, насыщенность 6 %, чистота цвета 0,51. Фактура также является ровной и матовой для избегания бликов.

С этим учетом общая картина цветового контраста остается средне выраженной, что соответствует среднему контрасту по цветовому тону при среднем яркостном контрасте[24].

Вывод: отделка помещения соответствует нормативам.


5.4.2 Обеспечение оптимальных параметров воздуха рабочих зон

Нормирование параметров микроклимата

Оптимальные нормы микроклимата приведены в таблице 5.3 (ГОСТ 12.1.005-88,СанПин 2.2.4.548-96).


Таблица 5.3 Оптимальные нормы микроклимата

Период годаКатегория работТемпература, ТВлажность, %Скорость воздуха, м/сХолодныйЛегкая - 1а22-2440-600,1Легкая - 1б21-2340-600,1ТеплыйЛегкая - 1а23-2540-600,1Легкая - 1б22-2440-600,2

Категорию работ отнесем к 1а (легкая), т.е. работы, производимые сидя и не требующие физического напряжения. При этом расход энергии составляет до 120 ккал/ч.

Анализ микроклимата в помещении.


Таблица 5.4 Микроклимат в помещении

Период годаКатегория работТемпература, ТВлажность, %Скорость воздуха, м/сХолодныйЛегкая - 1а2242-580,08ТеплыйЛегкая - 1а2445-590,1

Исходя из того, что в помещении стоит система кондиционирования воздуха, а также из анализа данных, можно сказать, что показатели микроклимата в помещении не выходят за пределы допустимых норм, которые указаны в САНПиН 2.2.4.548-96.

Нормирование уровней вредных химических веществ

Предприятие, на базе которого мы проводим исследования, находится в защищенной зоне с точки зрения экологии, поблизости нет большого движения автотранспорта. Рядом находится лесопарковая зона. По близости нет источников загрязнения, строительных площадок, промышленных предприятий. Ведь основной источник загрязнения - строительные конструкции, мебель, одежда, обувь.


Таблица 5.5 Вредные химические вещества

ВеществоПДК, мг/м3, ГОСТ 12.1.005-88 ГН 2.2.5.1313-03Концентрация в помещении, мг/м3Класс опасностиДействие на человекаМебель, одежда, обувьФенопласты62,193Общетоксическое, аллергическоеПолиэфирный лак61,992Капролактам104,813Поливинилацетат63,963Формальдегид0,50,0212Общетоксическое, раздражающееПыль растит. и животн. происхожд, с содеож. мин. волокна2-64,144Раздражающее, аллергическоеБензол54,752ОбщетоксическоеДиоксид углерода9 мг/л0,54 мг/л2НаркотическоеСероводород101,562Раздражающее и общетоксическоеАммиак204,114Пиридин53,112

1 класс - чрезвычайно опасные; 2 класс - высокоопасные; 3 класс - опасные; 4 класс - умеренно опасные.

Оценивая полученные данные можно сделать вывод, что состояние ПДК в рабочей среде в пределах нормы, однако значение бензола близко к максимальному. Чтобы уменьшить этот параметр, необходимо поставить специальные очистительные фильтры в приточно-вытяжные вентиляции.[26]

Нормирование уровней аэроионизации

Согласно требованиям к ионизации помещений для работы с ПЭВМ приведем сравнительную таблицу 5.6.


Таблица 5.6 Уровни ионизации воздуха помещений при работе на ВДТ и ПЭВМ

УровниЧисло ионов в 1 см куб. воздухаN+N-Минимально необходимые400600Оптимальные1500-30003000-5000Максимально допустимые5000050000Фактические22503170

Уровень положительных и отрицательных ионов в воздухе соответствует оптимальным значениям.

Параметры окружающего воздуха в целом не превышают ПДК, в соответствии с эффективным воздухообменом.

Лучше всего для получения оптимального значения ионизации воздуха рабочего помещения подходит установка оконного кондиционера, который осуществляет проветривание, увлажнение и ионизацию воздуха из внешней среды.

Определение вентиляционного воздухообмена обычно основано на площади помещения и количестве людей, находящихся в нем. Расчетные значения воздухообмена, определяемые по площади помещения, находятся в пределах 1-5 л/с·м2 (в зависимости от субъективного мнения проектировщика). При расчете воздухообмена согласно СНиП 41.01-2003, на количество людей получаются значения от 4 до 25 л/с·чел. Практически выбор величины воздухообмена производится экспертно и не основывается на величине фактического загрязнения воздуха. Так что для качественного воздуха установим величины воздухообмена 4 л/с·м2 и при расчете на количество людей - 20 л/с·чел.[20]


Таблица 5.7 Необходимый уровень воздухообмена [СНиП 41.01-2003]

Помещения (участок, зона)Помещениес естественным проветриваниембез естественного проветриванияПроизводственные30 м3/ч на чел.60 м3/ч на чел.

Для обеспечения комфортных условий и нормального самочувствия одного человека необходимо до 60 м3/час свежего воздуха при 50% относительной влажности и скорости воздухообмена 0,5 м/сек в помещении.


5.4.3 Создание рационального освещения

Правильное освещение в помещении складывается при наличии естественного и искусственного освещения. Напомним, что ориентация окон в сторону запада. Величина естественной освещенности зависит от КЕО, который определяется из СНиП 23-05-95 для средней точности работ (размер 0,5-1 мм, IVв) и составляет 1,5% при боковом освещении.

В рабочем помещении используется комбинированная система освещения, в качестве искусственного источника света установлены лампы ЛБ-40 со световым потоком 2800 лм. (ГОСТ 6825-91) в закрытых светильниках типа Н4Т4Л 1х65.


Рис. 5.5 Схема искусственного освещения


Светильники выполнены из металлического корпуса и вмещают 1 лампу.

Освещенность рассчитывается по формуле:


(5.2)

- световой поток одной лампы,- нормированная освещенность;- поправочный коэффициент (для стандартных светильников 1.1-1.3), 1.2;- коэффициент запаса (1.1-1.3), 1.2;- коэффициент использования, зависит от типа светильника, показателя (индекса) помещения, и т.п. (0.55-0.60), 0.6;- число люминесцентных ламп в светильнике.

Подставив эти значения в формулу получим:

= (9 x 2800 x 0.6 x 1) / (5 x 7 x 1.2 x 1.2) = 300 лк, что удовлетворяет требованиям.


Конструктивные особенности: рассеивание прямого излучения, что предотвращает появление прямой и отраженной блесткости.


Таблица 5.8 Естественное и искусственное освещение [СНиП 23-05-95]

Характеристика зрительной работы и наименьший размер объекта различия с фоном, мм.Разряд и подразряд зрительной работыКонтра-стность объекта с фономХар-ка с фономИскусственное освещение Освещенность, лкЕстествен. освещениеСовмещен. освещениеПри комбинирован-номПри сист. Общего осве-щенияКЕО, %всегоВ том числе от общегоПри комбинированномПри боковомПри комбинированномПри боковомСредней точности, 0,5 - 1 мм.4, вМ Ср БСв Ср Т40020020041,52,40,9

Для обеспечения рационального освещения в помещении для работы с ПЭВМ к общему освещению допускается установка светильников местного освещения для подсветки документов. Освещенность на поверхности стола в зоне размещения рабочего документа должна быть 300 - 500 лк. Местное освещение не должно создавать бликов на поверхности экрана.


5.4.4 Защита от шума

Как правило, основными источниками шума в помещениях, где осуществляется работа с применением ПК - это звуки, проникающие из вне: разговаривающие люди, отчасти, печатающая техника и сами ПК. Несмотря на то, что уровень шума с первого взгляда невелик, требования к соблюдению норм достаточно высоки. Это обусловлено большим влиянием данного фактора на здоровье человека.

Для уменьшения влияния шумов, в лаборатории при высоте помещения свыше 3,5 м к потолку необходимо подвешивать звукопоглотитель в виде поперечных и продольных диафрагм, обработанных с двух сторон специальным звукопоглощающим материалом. При работе оборудования со значительным уровнем шума должно применяться экранирование рабочих мест.

Допустимые уровни звукового давления на рабочих местах должны удовлетворять СаНПиН 2.2.4/2.18.562-96. В помещениях, где работают работники, осуществляющие аналитический и измерительный контроль - 60 дБ, в помещениях операторов ЭВМ - 65 дБ, на местах шумных машин - 75 дБ.

Сравнительная таблица фактических и нормируемых уровней шума в полосе октавных частот. ГОСТ 12.1.003-83, СН 2.2.4/2.1.8.562-96


Таблица 5.9 Фактические и нормирующие уровни шума

Вид трудовой деятельности, рабочие местаУровни звукового давления, дБ, в составных полосах со среднегеометрическими частотами, ГцУровни звука и эквивалентные уровни звука, ДБА31,5631252505001000200040008000Нормированное значение86716154494542403850Фактическое значение для широкополосного постоянного и непостоянного шума50524243453837211940Нормированное значение для импульсного шума81665649444037353350Фактическое значение (для тонального и импульсного)50524243453837312939

Допустимые уровни звукового давления на рабочих местах удовлетворяют СН 2.2.4/2.1.8.562-96.

Источником шума в основном является автомобильный транспорт, движение которого характерно только для начала и конца рабочего дня, поэтому играющей роли в показателях шума он не играет. Печатающая и утилизирующая техника используется крайне редко, поэтому в измерениях она не учитывается, их показатель шума не превышает нормы.

С учетом требований согласно трудовой деятельности и фактической величиной эквивалентного уровня звука помещение также соответствует нормам безопасности.


5.4.5 Обеспечение режимов труда и отдыха

Режимы труда и отдыха при работе с ПЭВМ и ВДТ должны организовываться в зависимости от вида и категории трудовой деятельности. Есть 3 группы трудовой деятельности: группа А - работа по считыванию информации с экрана ВДТ или ПЭВМ с предварительным запросом; группа Б - работа по вводу информации; группа В - творческая работа в режиме диалога с ЭВМ. В нашем случае разработки модуля, которая сопровождается творческой работой и программированием, работа относится к трудовой категории В, т.к. разработчик постоянно находится в режиме общения с машиной.[21]



Таблица 5.10 Время регламентированных перерывов

Категория работы с ВДТ или ПЭВМУровень нагрузки за рабочую смену при видах работ с ВДТСуммарное время регламентированных перерывов, мин.Группа А, количество знаковГруппа Б, количество знаковГруппа В, час.При 8-ми часовой сменеПри 12-ти часовой сменеIIIДо 60000До 40000До 6,070120

Продолжительность обеденного перерыва составляет 1 час, согласно правилами внутреннего трудового распорядка предприятия. Продолжительность непрерывной работы с ВДТ составляет 1 час. Таким образом, регламентированные перерывы установлены согласно СанПиН 2.2.2./2.4.1340-03 и составляют 10 минут после каждых 50 минут работы (всего 70 минут).

Работа оператора в нашем случае относится к категории «В», согласно которой среднее время работы оператора с ПЭВМ не должно превышать 6 часов за смену. На протяжении рабочей смены устанавливаются регламентированные перерывы. При 8-часовой рабочей смене для III категории работ перерывы устанавливаются через 1.5 - 2.0 часа от начала рабочей смены и через 1.5 - 2 часа после обеденного перерыва продолжительностью 20 минут каждый или продолжительностью 15 минут через каждый час работы.

Для предупреждения развития переутомления обязательными мероприятиями являются:

- проведение упражнений для глаз через каждые 20 - 25 минут работы за ПК;

устройство перерывов после каждого часа работы, независимо от объема работы, длительностью 10 - 15 минут;

подключение таймера к ПК или централизованное отключение свечения информации на экранах видеомониторов с целью обеспечения нормируемого времени работы на ПК;

проведение во время перерывов сквозного проветривания помещений с обязательным выходом персонала из него;

проведение упражнений физкультминутки в течение 1 - 2 минут для снятия локального утомления, которые должны выполняться индивидуально при появлении начальных признаков усталости.

К непосредственной работе с ВДТ и ПЭВМ допускаются лица, не имеющие медицинских противопоказаний. Профессиональные пользователи ВДТ и ПЭВМ должны проходить обязательные предварительные и периодические медицинские осмотры в порядке и в сроки, установленные Минздравмедпромом России и Госкомсанэпиднадзором России.


5.4.6 Обеспечение электробезопасности

Помещение с ЭВМ относится к классу помещений без повышенной опасности с точки зрения поражения электрическим током.

В ПЭВМ источником опасности является электрическая часть, а именно входные цепи блока питания, который может быть подключен к сети промышленного тока напряжением 220 В, частотой 50 Гц, с изолированной (заземленной) нейтралью. Выходные цепи блока питания составляют 15, 5 В. Блок питания содержит в себе схемы преобразования напряжения, схемы стабилизации и схему защитного отключения при коротком замыкании. Следовательно, согласно ПЭУ 1.1.3 устройство относится к установкам с рабочим напряжением до 1000 В.

Значение тока выше предельно допустимого значения (0,1 А) для переменного тока, следовательно, проектом предусмотрены следующие меры защиты: для защиты от поражения электрическим током все токоведущие части должны быть защищены от случайных прикосновений кожухами (ПУЭ 1.1.32); питание устройства должно осуществляется от силового щита через автоматический предохранитель, срабатывающий при коротком замыкании нагрузки. В рабочем помещении для защиты от поражения электрическим током при косвенном прикосновении используется устройство защитного отключения (УЗО) моделью ЩРН-П-12; поскольку сетевое напряжение образуется в блоке питания, выполненном в закрытом металлическом корпусе, электрически соединенным с корпусом всего устройства, то необходимо заземлить корпус всего компьютера, посредством заземленного вывода в сетевом шнуре или отдельно заземленным проводом к системе заземления в помещении. Заземление выполняется изолированным медным проводом сечением 1.5 мм2 (ПУЭ 1.7.78), который присоединяется к общей шине заземления с общим сечением 48 м2 при помощи сварки. Общая шина присоединяется к заземлению, сопротивление которого не должно превышать 4 Ом (ПУЭ 1.7.65).

Также обязательными мерами являются:

необходимо устанавливать ПЭВМ на жестко закрепленной подставке, исключающей даже случайное сотрясение системного блока;

следует применять стабилизированное питание ПЭВМ (с отклонением от 220В не более 10-15%). Сеть не должна иметь подключений электромоторов или других мощных или электропотребялющих устройств;

подводка сети для подключения устройств должна быть трехпроводной; ноль - электропитания, фаза, защитное заземление (или зануление, в зависимости от типа сети);

применять сетевой шнур с двойной изоляцией;

запрещается ремонт ПЭВМ и периферийных устройств, непосредственно в рабочем помещении;

в помещении должны быть непроводящие полы, отсутствовать токопроводящая пыль, отсутствовать электрически активная среда, отсутствовать возможность одновременного прикосновения к металлическим частям прибора и заземляющему устройству, отсутствовать высокая температура и сырость (ПУЭ 1.1.13).[23]


5.4.7 Защита от статического электричества

Для выполнения требований по электростатической безопасности должны быть предусмотрены средства защиты в соответствии с ГОСТ 12.4.124-83.

Нормирование допустимого поверхностного электростатического потенциала мониторов производится по СанПиН 2.2.2./2.4.1340-03 и не должны превышать 500В. Для защиты от воздействия электростатического электричества предусматриваются следующие меры:

- использование антистатических покрытий рабочей поверхности ВДТ;

необходима ежедневная влажная уборка помещения;

рекомендуется использование сотрудниками во время работы одежды из натуральных материалов;

использование защитного заземления;

использование антистатических полов;

не рекомендуется установка ПЭВМ и его клавиатуры на поверхность, которая легко собирает статическое электричество (например оргстекло);

необходимо ежедневно протирать влажной салфеткой экран, клавиатуру и другие части ПЭВМ.

Источником статического электричества в помещении могут быть остаточные заряды на незаземленных корпусах и экранах мониторов, трущиеся части принтера. Статическое электричество может привести к электрическому пробою, пожару, физиологическому воздействию на организм. [32]


5.4.8 Обеспечение допустимых уровней ЭМП

Приведем временные допустимые уровни ЭМП (в соответствии с СанПиН 2.2.2/2.4.1340-03) на рабочих местах пользователей, а также в помещениях образовательных учреждений.



Таблица 5.11 Временные допустимые уровни ЭМП, создаваемых ПЭВМ

Наименование параметровВДУНапряженность электрического поляв диапазоне частот 5 Гц - 2 кГц25 В/мв диапазоне частот 2 кГц - 400 кГц2,5 В/мПлотность магнитного потокав диапазоне частот 5 Гц - 2 кГц250 нТлв диапазоне частот 2 кГц - 400 кГц25 нТлНапряженность электростатического поля15 кВ/м

Приведем результаты измерения напряженности электромагнитного поля по электрической составляющей, плотности магнитного потока, поверхностного электростатического потенциала на 4 рабочих местах, оснащенных ПЭВМ. Все измерения соответствуют требованиям СаНПиН 2.2.2./2.4.1340-03. Достичь ВДУ ЭМП позволяет оборудование помещение соответствующей техникой, отвечающей действующим стандартам по безопасности и правильное размещение рабочих мест.


Таблица 5.12 Результаты измерений уровней ЭМП

№ п/пМесто измеренияРасст. от источника, мНапряженность электромагнитного поля по эл. Составляющей в диапазонах частот, В/мПлотность магнитного потока в диапазонах частот, нТлПоверхностный электростатический потенциал, ВНапряженность электростатического поля, кВ/м5 Гц -2 кГц2 кГц -400 кГц5 Гц -2 кГц2 кГц - 400 кГц1Рабочее место № 10,520,52,290,03,22567,22Рабочее место № 20,520,51,7130,06,54515,13Рабочее место № 30,522,02,1110,03,93585,94Рабочее место № 40,520,01,7130,04,63036,4ПДУ25,02,5250,025,050015,0


5.4.9 Обеспечение пожарной безопасности

Помещения, в которых установлены персональные ЭВМ, должны удовлетворять требованиям по предотвращению и тушению пожара по ГОСТ 12.1.004-91. Обязательно наличие телефонной связи и пожарной сигнализации.

В соответствии со СНиП 21-01-97 степень огнестойкости основных строительных конструкций относится к III-й категории.

Согласно НПБ 105-03 помещение соответствует категории Д (отсутствуют взрывоопасные вещества и легковоспламеняющиеся жидкости, вещества в холодном состоянии не являются горючими).


Таблица 5.13 Степени огнестойкости зданий

Степень огнестойкости зданияМаксимальные пределы огнестойкости строительных конструкцийНесущие элементы зданияНаружные стеныПерекрытиямеждуэтажные чердачные и над подваломПокрытия бесчердачныеЛестничные клеткиВнутренние площадкиМарши ЛестницIIIR 45E 15REI 45RE 15REI 60R 45

Класс возможного пожара в данном помещении А и Е.

При защите помещений с ПЭВМ, следует учитывать специфику взаимодействия огнетушащих веществ с защищаемыми оборудованием, изделиями, материалами. Данные помещения следует оборудовать хладоновыми и углекислотными огнетушителями в соответствии с учетом ПДК огнетушащего вещества.

Материалы, применяемые для ограждающих конструкций и отделки рабочих помещений должны быть огнестойкими. Для предотвращения возгорания в зоне расположения ЭВМ обычных горючих материалов (бумага) и электрооборудования, необходимо принять следующие меры:

в отделе должны быть размещены углекислотные огнетушители типов ОУ-2, ОУ-5, ОУ-8. Согласно типовым правилам пожарной безопасности на каждые 100 кв. метров площади помещения ВЦ должен приходиться один огнетушитель;

в качестве вспомогательного средства тушения пожара могут использоваться гидрант или устройства с гибкими шлангами. [29]

В здании предусмотрен эвакуационный выход в соответствии с СНиП 31-03-2001;изображена схема эвакуации из помещения в случае пожара и повешена на входную дверь. Класс функциональной пожарной опасности предприятия - Ф5 Производственные и складские здания, сооружения и помещения (для помещений этого класса характерно наличие постоянного контингента работающих, в том числе круглосуточно) по Федеральному закону от 22 июля 2008 г. № 123-ФЗ "Технический регламент о требованиях пожарной безопасности.

В соответствии со ст. 79 Федерального закона от 22 июля 2008 г. № 123-ФЗ «Технический регламент о требованиях пожарной безопасности»[33], индивидуальный пожарный риск (нормативная величина пожарного риска) в зданиях, сооружениях и строениях не должен превышать значение одной миллионной в год при размещении отдельного человека в наиболее удаленной от выхода из здания, сооружения и строения точке.

Обеспечение безопасной эвакуации персонала

В исследуемом здании имеются эвакуационные выходы: на первом этаже - непосредственно ведет наружу, на каждом этаже - ведет на лестничную клетку. Выходы считаются эвакуационными, если они ведут из помещений любого этажа, кроме первого, в коридоры, ведущие в лестничную клетку (в том числе через холл), при этом лестничные клетки должны иметь выход наружу непосредственно или через вестибюль, отдельный от примыкающих коридоров перегородкой с дверями.

Ширина эвакуационного выхода должна быть не менее 1,2 м, высота - 1,9 м.

Фактическое расстояние между двумя наиболее удаленными эвакуационными выходами 50 метров, ближайшим эвакуационным выходом является выход из помещения. Проверяется соответствие расстояния по формуле:


(5.3)


где l - минимальное расстояние (м) между наиболее удаленными друг от друга эвакуационными входами из помещения;

p - периметр этажа (м). Периметр помещения в данном случае равен 150 м.

п - число эвакуационных выходов (2 в данном случае)

Тогда:


м


> 18,4 следовательно, требование рассредоточенности эвакуационных выходов соблюдено.

Фактическое расстояние от наиболее удаленного рабочего места до эвакуационного выхода составляет 18,4 м, при этом объем помещения 15,2 тыс. м3; категория помещения по пожароопасности - Д; степень огнестойкости здания - III; плотность людского потока в общем проходе - 2 чел/м2. Согласно СП 1.131 30.2009 наибольшее расстояние до эвакуационного выхода не должно превышать 95 м.

Требования СП 1.131 30.2009 и федерального законодательства по обеспечению безопасности эвакуации людей при пожаре соблюдены.

Средства извещения и сигнализации о пожаре

Основным средством извещения о пожаре на предприятии являются комбинированные извещатели типа КИ-1 из расчета один извещатель на 100 м2 помещения. Подобный извещатель эффективен в дымах любой природы, а также данный извещатель передает сигнал о пожаре по радиотелекоммуникационной системе на центральный узел связи "01" Государственной противопожарной службы. Однако, у радиоизотопных извещателей есть и недостатки, речь идет об использовании в конструкции извещателей источника радиоактивного излучения. Из-за этого, возникают проблемы соблюдения мер безопасности при эксплуатации, хранении и транспортировки, а также утилизации извещателей после окончания срока эксплуатации.

Способы и средства тушения пожара

В данном помещении имеются огнетушители ОП-8(з): масса заряда порошка - 8 кг, длина струи огнетушащего вещества - 4,5 м, продолжительность подачи огнетушащего вещества - 10 с, Огнетушащая способность (площадь, м2) 4А (18,66);144В (4,52), длина выброса 4,5м, масса 11-12кг, габариты 585х260х230мм.

Для рассматриваемого помещения классами пожара являются А и Е: класс А - пожары твердых горючих веществ и материалов, класс Е - пожары горючих веществ и материалов электроустановок, находящихся под напряжением. Рекомендуемыми огнетушащими средствами являются:

класс А - тушение пожаров, связанных с горением обычных твердых горючих веществ, таких как древесина, бумага, ткани и пластмассы, наиболее эффективно проводится водой, которая является средством охлаждения. Можно использовать также пену или огнетушащие порошки, обеспечивающие в основном поверхностное тушение.

класс Е - галоидоуглеводороды, диоксид углерода, порошки.

Отсюда можно сделать вывод, что помещение полностью оборудовано средствами тушения пожара.

Молниезащита объекта

Ожидаемое количество поражений в год (N) зданий и сооружений, не оборудованных молниезащитой, определяется из выражения:


(5.4)


где l и b - соответственно длина и ширина здания, м;- наибольшая высота здания по его боковым сторонам, м ;- среднее число поражений молнией 1 км2 земной поверхности в год, зависящее от интенсивности грозовой деятельности, ч/год (n=2,3).

= 70 м= 45 м= 25 м= 2,3


Данный тип здания относится к I категории по категории устройства молниезащиты согласно СО - 153.34.21.122-2003.


5.4.10 Мероприятия и средства по защите окружающей среды

Утилизация компьютеров и оргтехники

Развитие современных технологий привело к серьезной проблеме утилизации электронных отходов и ее масштабы постоянно увеличиваются. В настоящее время все страны вынуждены привлекать значительные усилия и средства для ее решения.

Неправильная <#"justify">Этапы технологического процесса переработки оргтехники, электроники и бытовой техники:

)На первом этапе проводится ручная разборка продукции с выделением опасных элементов и материалов, пригодных для вторичного использования. Квалифицированные специалисты проводят разборку утилизируемой техники с выделением всех опасных материалов (в первую очередь ртутьсодержащих люминесцентных ламп). Они помещаются в специальные герметичные контейнеры и направляются на обезвреживание специализированным предприятиям-переработчикам. Компоненты, из которых можно извлекать драгметаллы (например, золото из печатных плат) извлекаются и помещаются в пластиковые контейнеры или полиэтиленовые пакеты. Эти компоненты передаются по договору в специализированные организации, имеющие свидетельства о постановке на учет Инспекцией пробирного надзора Минфина РФ. В дальнейшем отделяются детали, пригодные для дальнейшего рециклинга (полимеры, металл и др.).

)На втором этапе проводится механизированное измельчение отходов в дробилке в соответствии с утвержденным технологическим регламентом процесса переработки неликвидной продукции.

)Измельченные материалы помещают в герметичные контейнеры. На третьем этапе их используют для получения продукции.

Утилизации компьютерной техники и оргтехники позволяет вернуть в производство ценные соединения и металлы. Кроме того, эти элементы могут пускаться в переработку в качестве вторичного сырья и свести к минимуму отходы, которые не перерабатываются. Часть драгоценных материалов, которые содержатся в утилизированной технике, должна сдаваться в Государственный Фонд России.


Таблица 5.14. Тяжелые металлы, воздействие их на организм человека

МеталлВлияние на организм человекаРтутьНаибольшую опасность составляют пары ртути и ее органические соединения. Способна проникать в организм через дыхательные пути. При большом поступлении в организм происходит отравление (токсикация).КадмийОбладает способностью накапливаться в организме. Период полувыведения составляет 10-35 лет. Накапливается главным образом в почках и печени (60-80%). Остальные 40% содержаться в поджелудочной железе, селезенке, трубчатых костях, других органах и тканях. Накапливаясь в организме, может привести к нарушению работы почек.СвинецВдыхание свинцовой пыли намного опаснее, чем попадание его в организм с пищей. При попадании в мягкие ткани (мышцы, печень, почки, головной мозг, лимфатические узлы) свинец вызывает заболевание - сатурнизм. Блокируя деятельность некоторых ферментов, свинец способен вызвать развитие анемии, поражение кроветворной системы, почек и мозга, снижение интеллекта (особенно у детей)МедьНакапливаясь в организме, образует депо преимущественно в печени.МышьякИмеет способность накапливаться в организме и образовывать депо в костях, печени, стенках желудка, почках, почках, коже, волосах, ногтях и даже в мозге. Вызывают поражения нервной системы и сильнейшие отравления организма.

Правильная утилизация электронных компонентов играет огромное значение для исследуемого предприятия, и, главное, чтобы она производилась на высоком профессиональном уровне[27].


5.5 Инженерные расчеты


.5.1 Расчет естественного освещения

Помещения с постоянным пребыванием людей должны иметь естественное освещение.

Естественное освещение - освещение помещений прямым или отраженным светом, проникающим через световые проемы в наружных ограждающих конструкциях. Естественное освещение должно предусматриваться, как правило, в помещениях с постоянным пребыванием людей.

Для данного помещения вид естественного освещения - это боковое одностороннее - когда световые проемы расположены в одной из наружных стен помещения.


Рис. 5.7 Боковое одностороннее естественное освещение


Естественное освещение используется для общего освещения производственных и подсобных помещений. Оно создается лучистой энергией солнца и на организм человека действует наиболее благоприятно.

Помещения с постоянным пребыванием людей должны иметь естественное освещение. Установленные расчетом размеры световых проемов допускается изменять на +5, -10%.

Качество освещения естественным светом характеризуется коэффициентом естественной освещенности КЕО, который представляет собой отношение освещенности на горизонтальной поверхности внутри помещения к одновременной горизонтальной освещенности снаружи:


(5.6)


где Ев - горизонтальная освещенность внутри помещения в лк;

Ен - горизонтальная освещенность снаружи в лк.

Строительными нормами и правилами (СНиП 23-05-95) коэффициенты естественной освещенности производственных помещений установлены в зависимости от характера работы по степени точности.

Только часть проникающего через окна светового потока падает на рабочую плоскость (горизонтальная плоскость на высоте 1 м от пола), остальная часть приходится на другие поверхности помещений, которые лишь частично отражают световой поток на рабочую плоскость. По многочисленным измерениям в школах, магазинах и фабриках коэффициент использования при вертикальных окнах составляет 30 -50%. Поэтому можно принимать среднее значение 40%, что примерно соответствует коэффициенту использования при искусственном освещении помещения.

Средняя горизонтальная освещенность в помещении определяется по формуле:


(5.7.)


Если принять горизонтальную освещенность на открытом воздухе Ен = 1500 лк, освещенность наружной поверхности окна Еок = 30%, коэффициент использования ? = 40%,

Одно окно в исследуемом помещении имеет размеры 2 м х 1,2 м, всего 2 окна. Отсюда площадь окон Fок = 4,8 .


Fпом = 5м х 7м = 35

Ев=0,3*0,4*1500*4,8/35= 24,7 лк


Кео из СНиП 23-05-95 для средней точности работ (размер 0,5-1 мм, IVв) составляет 1,5% при боковом освещении.

Отсюда можно сделать вывод, что размеры световых проемов, а значит и Кео соответствуют норме.


5.6 Выводы по разделу


В данном разделе дипломного проекта была исследована потенциальная опасность данного вида трудовой деятельности для человека, возможности возникновения чрезвычайных ситуаций.

Был рассмотрен ряд вопросов по технике безопасности, производственной санитарии, экологичности производства, посчитаны нормы, предложены решения, направленные на улучшение соответствия заданным нормативам.

Были перечислены мероприятия и средства по обеспечению труда, производственной санитарии, защите окружающей среды и обеспечению защиты при чрезвычайных ситуациях.

В расчетной части приведены расчеты искусственного и естественного освещения.


Заключение


В данном дипломном проекте было разработано алгоритмическое обеспечение динамического отслеживания лиц в видеопоследовательностях. В связи с развитием технологий в области обработки сигналов и изображений в режиме реального времени все большее распространение находят сложные компьютерные системы, обеспечивающие возможность видеоконтроля в зоне обзора с автоматическим распознаванием объекта наблюдения. Зоной обзора в большинстве случаев является конкретное пространство, находящееся под контролем интеллектуальной экспертной системы безопасности, которая принимает решения аналогично человеку-охраннику. Для принятия такой системой решения ей необходимы определенные данные об объекте, которые можно получить за счет отслеживания ключевых признаков объекта. В случае, если таким объектом является человек, наиболее характерные признаки можно получить путем отслеживания его лица. При этом системе приходится иметь дело с нестатическими изображениями или, иначе говоря, с видеопоследовательностью.

Одним из основных элементов процесса отслеживания является определение (предугадывание) позиции объекта, например, лица, в следующем кадре, основанное на предположениях, сделанных по позиции объекта в предыдущем кадре. Отслеживание - это очень быстрая операция по сравнению с выделением и распознаванием, именно поэтому она является ключевым элементом любой системы распознавания, работающей в режиме реального времени в таких приложениях как: распознавание лиц, видеоконференции, наблюдение, интерфейс «человек-машина», виртуальная реальность, зрение роботов.

Следовательно, разработка данного алгоритмического обеспечения - актуальная задача.

Таким образом, в дипломном проекте в соответствии с заданием были разработаны:

архитектура средств динамического отслеживания лиц;

алгоритм динамического отслеживания лиц;

программное обеспечение протестировано на работоспособность и точность распознавания (видео допускает смены планов трансляции, при этом объект все равно отслежен);

приведена экономическая целесообразность проекта;

учтены экологические аспекты при разработке.

Также были рассмотрены основные методы и алгоритмы распознавания лиц и объектов в видеопотоке и указаны их основные достоинства и недостатки. Рассмотрены основные методы выделения движущихся объектов.

Отдел, в котором происходит вся работа, включает в себя некоторое количество рабочих мест, оборудованных вентиляцией, местным освещением, необходимым оборудованием. В процессе разработки алгоритма и ПО, наиболее опасным, с точки зрения безопасности и экологичности, является влияние статического и электромагнитного полей на человека, а также электробезопасность. Эти особенности требуют от персонала соблюдения правил техники безопасности, а также общей культуры работы.

ПО, разработанное на основе алгоритма динамического отслеживания лиц, уже используется в ФГУП НИИ «Квант».


Список литературы


1.Брилюк Д.В., Старовойтов В.В. Распознавание человека по изображению лица нейросетевыми методами. - Минск, 2002.

.Алфимцев А.Н., Лычков И.И. Метод обнаружения объекта в видеопотоке в реальном времени // Вестник ТГТУ.- 2011.- Т. 17.- № 1

3.Козлов В.А., Потапов А.С. Анализ методов выделения движущихся объектов на видеопоследовательностях с шумами // Научно-технич. вестник СПГУ ИТ. - 2011. - № 3 (73)

.Байгарова Н.С., Бухштаб Ю.А. Некоторые принципы организации поиска видеоданных // Программирование.- 1999.- № 3

5.http://www.emgu.com Сайт о Emgu CV

.http://www.aforgenet.com Сайт для разработчиков и исследователей в области компьютерного зрения

7.http://www.cognitec-systems.de Сайт программного продукта FaceVACS

8.http://www.visagetechnologies.com Ресурс о среде для разработчиков Visage|SDK

.http://habrahabr.ru Новостной сайт об ИТ

10.http://research.microsoft.com Сайт об исследованиях компании Microsoft

11.http://software.intel.com Сайт компании Intel

12.http://www.neurotechnology.com Ресурс о нейронных сетях

.http://sl-matlab.ru Сайт о программных продуктах MatLab

.http://ru.wikipedia.org OpenCV Электронная энциклопедия

.Алфимцев А.Н. Разработка и исследование методов захвата, отслеживания и распознавания динамических жестов// МГТУ им. Н.Э. Баумана.- Москва, 2008.

.Ирматов А.А., Буряк Д.Ю. Способ и система для распознавания лица с учетом списка людей, не подлежащих проверке// Корпорация «Самсунг электроникс Ко., Лтд.».-Москва, 2010.

17.International Standard ISO/IEC 19794-5:2005. Information technology - Biometric data interchange formats - Part 5: Face image data.

18.FaceVACSTechnology. B6T8 Algorithm Performance. http://www.cognitec-systems.de/fileadmin/cognitec/media/technology/FaceVACS-biometric-performance-b6t8.pdf.

19.Гигиенические требования к персональным электронно-вычислительным машинам и организация работы /СанПиН 2.2.2/2.4.1340-03. - М.: Госкомэпиднадзор, 2003

20.Гигиенические требования к аэроионному составу воздуха производственных и общепроизводственных и общественных помещений СанПиН 2.2.4.1194-03. - М.: Госкомэпиднадзор, 2003.

21.Денисенко Г.Ф. Охрана труда. - М.: Высшая школа, 1985.

.Павлов С.П., Губонина З.И. Охрана труда в приборостроении. - М.: Высшая школа, 1986.

.Правила Устройства Электроустановок /ПУЭ/, 7 изд. - М.: ЗАО «Энергосервис», 2003.

.Указания по проектированию цветовой отделки интерьеров производственных зданий промышленных предприятий /СН-181-70/. -М.: Стройиздат, 1972.

.Долин П.А. Справочник по технике безопасности. - М.: Энергоатомиздат, 1985.

.Справочник предельно допустимых концентраций вредных веществ в пищевых продуктах и среде обитания. М.: Издательство МГОУ, 1993.

.Защита окружающей среды от техногенных воздействий / под ред. Г.Ф. Невской. - М.: Издательство МГОУ, 1993.

.Охрана труда в вычислительных центрах. - М.: Машиностроение, 1990.

.Пожарная безопасность. Взрывобезопасность: справочник / под ред. А.И. Баратова. - М.: Химия. 1987.

.Кораблев В.П. Электробезопасность. - М.: Московский рабочий, 1985.

.Лапин В.Л. и др. Безопасное взаимодействие человека с техническими системами. - Курск, 1995.

.Афанасьев А.И., Карнаух О.И. и др. Обеспечение электромагнитной безопасности, устойчивости работы и электромагнитной совместимости компьютерной и офисной техники в реальных условиях ее эксплуатации. ФГУП «НПП» «Циклон-Тест», 2004.

.Федеральный закон №123-ФЗ от 22.07.2008г. «Технический регламент о требованиях пожарной безопасности».


Оглавление Введение Глава 1. Обзор литературы и постановка задачи 1.1.Постановка задачи 1.2. Существующие алгоритмы и методы 1.2.1.Алгоритмы

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ