- Дипломы
- Курсовые
- Рефераты
- Отчеты по практике
- Диссертации
Обоснование внедрения системы распознавания лиц человека в потоке в комплексную систему обеспечения безопасности г
Внимание: Акция! Курсовая работа, Реферат или Отчет по практике за 10 рублей!
Только в текущем месяце у Вас есть шанс получить курсовую работу, реферат или отчет по практике за 10 рублей по вашим требованиям и методичке!
Все, что необходимо - это закрепить заявку (внести аванс) за консультацию по написанию предстоящей дипломной работе, ВКР или магистерской диссертации.
Нет ничего страшного, если дипломная работа, магистерская диссертация или диплом ВКР будет защищаться не в этом году.
Вы можете оформить заявку в рамках акции уже сегодня и как только получите задание на дипломную работу, сообщить нам об этом. Оплаченная сумма будет заморожена на необходимый вам период.
В бланке заказа в поле "Дополнительная информация" следует указать "Курсовая, реферат или отчет за 10 рублей"
Не упустите шанс сэкономить несколько тысяч рублей!
Подробности у специалистов нашей компании.
Только в текущем месяце у Вас есть шанс получить курсовую работу, реферат или отчет по практике за 10 рублей по вашим требованиям и методичке!
Все, что необходимо - это закрепить заявку (внести аванс) за консультацию по написанию предстоящей дипломной работе, ВКР или магистерской диссертации.
Нет ничего страшного, если дипломная работа, магистерская диссертация или диплом ВКР будет защищаться не в этом году.
Вы можете оформить заявку в рамках акции уже сегодня и как только получите задание на дипломную работу, сообщить нам об этом. Оплаченная сумма будет заморожена на необходимый вам период.
В бланке заказа в поле "Дополнительная информация" следует указать "Курсовая, реферат или отчет за 10 рублей"
Не упустите шанс сэкономить несколько тысяч рублей!
Подробности у специалистов нашей компании.
Код работы: | W011436 |
Тема: | Обоснование внедрения системы распознавания лиц человека в потоке в комплексную систему обеспечения безопасности г |
Содержание
СОДЕРЖАНИЕ ВВЕДЕНИЕ 1. Теория распознавания образов. 1.1. Распознавание образов 1.2 Распознавание лиц 1.3. Требование к системе 2. Практическое применение системы 2.1. Комплексные системы безопасности 2.2. Проект «Безопасный город» 2.3 Аналоги 2.4. Предложение по внедрению 2.5. Картирование территории г. Вологды 3.Оценка стоимости системы безопасности территории г. Вологды 3.1. Система видеонаблюдения и видеозаписи 3.2. Расчет затрат на разработку ПО для распознавания лиц 3.3 Расчет эксплуатационных затрат 4. Патентные исследования Заключение Приложения Перечень сокращений, условных обозначений, символов, единиц, терминов 1.Общие данные об объекте исследования 2. Информационная ситуация по РФ. 2.1. Динамика регистрации по годам 2.2 Анализ правообладателей 2.3 Научно-техническая документация 2.4 Оценка технического уровня Заключение Приложение А.А Приложение А.Б Приложение А.В Введение Актуальность темы. В последнее время в связи с обострившейся политической ситуацией вопросы безопасности городов, предприятия и территорий в целом, становятся как никогда актуальными. Обеспечение безопасности в 21 веке базируется на новейших технологиях и одними из самых сложных из них являются технологии распознавания лиц. О важности этой проблемы говорит тот факт, что исследования по распознаванию образов, анализу изображений и речи включены в перечень приоритетных направлений развития науки и техники и критических технологий федерального уровня. Задача идентификации и распознавания лиц – это одна из первых практических задач, которая стимулировала становление и развитие теории распознавания и идентификации объектов, а также является одной из основных систем комплекса безопасности. В данном случае, конкретно – система распознавания лиц в потоке людей. Для решения задачи распознавания лиц используются различные методики, среди которых можно выделить подходы, основанные на нейронных сетях, на разложении Кархунена–Лоэва, на алгебраических моментах, линиях одинаковой интенсивности, эластичных (деформируемых) эталонах сравнения. Анализ методов выделения сюжетной части изображения показал, что для решения данной задачи эффективно использовать искусственные нейронные сети, в связи с тем, что они обеспечивают возможность получения классификатора, хорошо моделирующего сложную функцию распределения изображений лиц, тем самым, увеличивая точность решения по сравнению с остальными методами [1]. Однако одного этого элемента недостаточно для того, чтобы обеспечить всестороннюю защиту охраняемого объекта. Для этого стоит прибегнуть виду систем безопасности, именуемыми – комплексными, включающие в себя широкий спектр систем обеспечения контроля, наблюдения и предотвращения чрезвычайных ситуаций. К тому же системы безопасности должны быть качественными и эффективными, соответствовать установленным стандартам и, желательно, быть простыми в обслуживании. Целью данной работы является обоснование внедрения системы распознавания лиц человека в потоке в комплексную систему обеспечения безопасности г. Вологды. Основные задачи магистерской диссертационной работы: 1. Составление описания систем распознавания видео изображений, включающий в себя обзор систем, основанных на методике нейронных сетей. 2. Составление описания комплексных систем обеспечения безопасности. 3. Предложение описания алгоритма системы комплексной безопасности территории ТГУ. 4. Оценка территории г. Вологды с выявлением предполагаемых точек, с которых возможен несанкционированный доступ. 1.Теория распознавания образов 1.1. Распознавание образов Распознавание образов — это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы несущественных данных[15]. Под образом будем понимать наименование области в пространстве признаков, в которой отображается множество объектов или явлений материального мира. Признак – количественное описание того или иного свойства исследуемого предмета или явления[6]. Пространство признаков — это N-мерное пространство, определенное для данной задачи распознавания, где N – фиксированное число измеряемых признаков для любых объектов. Вектор из пространства признаков x, соответствующий объекту задачи распознавания это N-мерный вектор с компонентами (x_1,x_2,…,x_N), которые являются значениями признаков для данного объекта. Другими словами, распознавание образов можно определить, как отнесение исходных данных к определенному классу с помощью выделение существенных признаков или свойств, характеризующих эти данные, из общей массы несущественных деталей[2]. Чаще всего исходным материалом служит полученное с камеры изображение. Задачу можно сформулировать как получение векторов признаков для каждого класса на рассматриваемом изображении. Процесс можно рассматривать как процесс кодирования, заключающийся в присвоении значения каждому признаку из пространства признаков для каждого класса[13]. Ниже приведены некоторые методы распознавания образов: 1.1.1. Фильтрация Далее будут описаны методы, позволяющие выделить на изображениях интересующие области, без их анализа. Большая часть этих методов применяет какое-то единое преобразование ко всем точкам изображения. В общем случае под фильтрацией изображения понимают операцию, результатом которой будет изображение, которое получили по заданным правилам из начального изображение с таким же размером. На уровне фильтрации анализ изображения не производится, но точки, которые проходят фильтрацию, можно рассматривать как области с особыми характеристиками. Оценка качества фильтра производится по: 1) Способности фильтра удалять помехи с изображения 2) Способности фильтра сохранять на изображении все мелкие детали и контуры форм. а) Бинаризация по порогу, выбор области гистограммы. Это самое просто преобразование. Довольно часто можно встретить идеальные задачи, в которых применение такого преобразования окажется достаточно. Допустим, необходимо автоматически распознать предметы на белом листе бумаги (рисунок 1). а) б) Рисунок 1 - Распознавание объектов, расположенных на чистом листе белой бумаги: а) до распознавания б) после распознавания Выбор порога, по которому происходит бинаризация, как правило определяет процесс бинаризации. В данном случае, изображение было бинаризовано по среднему цвету. Обычно бинаризация осуществляется с помощью алгоритма, который адаптивно выбирает порог. Таким алгоритмом может быть выбор математического ожидания или медианы. Ну или можем ориентироваться на наибольший пик гистограммы (рисунок 2) Рисунок 2 – Наибольший пик гистограммы. Бинаризация дает очень интересные результаты если работать с гистограммами, особенно в ситуации, когда мы распознаем не КЗС изображение, а в HSB. Можно к примеру, выделить интересующие цвета. На этом принципе можно построить как детектор метки, так и детектор кожи человека. (Рисунок 3) а) б) Рисунок 3 – Метод бинаризации по порогу примененный к фотографии человека: а) до распознавания б) после распознавания б) Частотная фильтрация: Фурье-анализ, Фильтр нижних частот (ФНЧ), Фильтр верхних частот (ФВЧ) Такие методы фильтрации и обработки сигналов прекрасно применяются во множестве задач теории распознавания образов. Для радиолокации классическим методом будет являться преобразование Фурье (конкретнее – Быстрое преобразование Фурье). В целом метод частотной фильтрации основывается на модификации сигнала путем применения к изображению двумерного преобразования Фурье, но об этом далее. Суть преобразования Фурье в том, что оно позволяет представить практически любой набор данных или же функцию в виде комбинации тригонометрических функций – синуса и косинуса, а это, в свою очередь, позволяет выявить периодические компоненты в данных и далее оценить их вклад в структуру исходных формы функции или данных. Как правило существует три основные формы преобразования Фурье: интегральное преобразование Фурье, ряды Фурье и дискретное преобразование Фурье. Интегральное преобразование Фурье переводит одну комплексную функцию в другую или вещественную функцию в пару вещественных функций. Основным принципом частотной фильтрации будет являться фон и крупноразмерные объекты, которые соответствуют низким частотам. Однако существует одно из немногих исключение, при которых используется одномерное преобразование Фурье, — компрессия изображений. Обычно для анализа изображений одномерного преобразования не хватает, и в таком случае необходимо использовать более ресурсо?мкое двумерное преобразование (рисунок 4). ???1 ???1 1 ?2???? ???? +???? ?????? = ???? ?????? ?? ??=1 ?? =1 ?? ?? Рисунок 4 – Формула дискретного преобразование Фурье для двумерного массива чисел Но в действительности его мало кто рассчитывает, как правило, куда проще и быстрее использовать св?ртку интересующей области с уже готовым фильтром, заточенным на высокие (ФВЧ) или низкие(ФНЧ) частоты. Метод этот, конечно, не позволит сделать анализ спектра, но в конкретной задаче видеоаналитики обычно нужен не столько сам анализ, как его результат. Св?ртка функций — это операция, применяющаяся в функциональном анализе. По определению, св?ртка — это математическая операция, примен?нная к двум функциям f и g, порождающая третью функцию, которая иногда может рассматриваться как модифицированная версия одной из первоначальных. По сути, эту операцию можно рассматривать как особый вид интегрального преобразования. Самыми простыми примерами, реализующими подч?ркивание низких частот, являются фильтр Гаусса, а для высоких частот - Фильтр Габора. Фильтр Гаусса — электронный фильтр, чьей импульсной переходной функцией является функция Гаусса. Фильтр Гаусса он спроектирован таким образом, чтобы не иметь перерегулирования в переходной функции и максимизировать постоянную времени. Такое поведение тесно связано с тем, что фильтр Гаусса имеет минимально возможную групповую задержку. Фильтр Гаусса как правило используется только в цифровом виде для обработки двумерных изображений с целью снижения уровня помех. Однако при изменении частоты дискретного сигнала он дает сильное размытие изображения. Фильтр Габора — линейный электронный фильтр, импульсная переходная характеристика которого определяется в виде гармонической функции, помноженной на гауссиан. При цифровой обработке изображений этот фильтр применяется для распознавания границ объектов. Из-за свойства соответствия св?ртки в частотной области умножению во временной области, преобразование Фурье импульсной передаточной характеристики фильтра Габора является св?рткой преобразований Фурье гармонической функции и гауссиана. Для каждой точки изображения выбирается окно и перемножается с фильтром того же размера. Результатом такой св?ртки является новое значение точки. При реализации ФНЧ и ФВЧ получаются изображения, отображенные на рисунке 5: Рисунок 5 – Изображения, получающиеся при реализации методов ФНИ и ФВЧ. в) Фильтры, основанные на порядковых статистиках Такие фильтры как правило представляют собой пространственные фильтры, для вычисления результата которых требуется предварительное упорядочивание значение пикселей, которое находятся внутри области обработки. * одними из самых популярных фильтров данного видя являются: * медианный фильтр; * фильтр, основанный на вычислении максимумов и минимумов; * фильтр средней точки; * фильтр усредненного среднего. Рассказать о данных фильтрах проще всего на примере медианного, так как он является достаточно популярным в практической деятельности. Суть данного фильтра заключается в замене значения в точке изображения на медиану значений яркости в окне фильтрации этой точки в размере окна, m*n. ?? ??, ?? = ?????????0,5 ???1 ??+0,5 ???1 1 ?? ??, ?? . Остальные фильтры, в основу которых входят порядковые статистики, работают по подобному принципу, но вместо медианы берут другие статистические особенности элементов фильтрации. Например, фильтры, основанные на вычислении максимума или минимума, о которых рассказывалось выше, определяют, как понятно из названия, максимальное или минимальное значение яркости элемента окна фильтрации, после чего присваивают это значение центральному элементу, а это, в свою очередь позволяет избавится от черных – для максимума и белых – для минимума помех, имеющих максимальную или минимальную яркость. г) Вейвлет- преобразование. Вейвлет-преобразование (англ. Wavelet transform) — интегральное преобразование, которое представляет собой свертку вейвлет-функции с сигналом. Вейвлет-преобразование переводит сигнал из временного представления в частотно-временное. Данный метод основан на преобразовании функции или сигнала в форму, некоторые вылечены исходные сигналы которого, становятся более поддающимися изучению, или же позволяет сжать исходный набор данных. Вейвлетное преобразование сигналов является обобщением спектрального анализа. Термин (англ. wavelet) в переводе с английского означает «маленькая волна». Вейвлеты - это семейство функций, которые локальны во времени и по частоте («маленькие»), и в которых все функции получаются из одной посредством ее сдвигов и растяжений по оси времени (так что они «идут друг за другом»). Данное определение вейлветов хоть и не является корректным, но традиционно сложилось, что под вейлвет-анализом понимают именно поиск произвольного шаблонна или образца на изображении при помощи св?ртки с моделью этого образца. Существует несколько классических функций, используемых в вейвлет-анализе. К ним относятся вейвлет Хаара, вейвлет Морле, вейвлет мексиканская шляпа, и.т.д. Четыре примера классических вейвлетов показаны на рисунке 6. Хорошим примером использования расширенной трактовки вейвлетов является задача поиска блика в глазу, для которой вейвлетом является сам блик, показанный на рисунке 7. а) б) в) г) Рисунок 6 –а) Х-мерный вейвлет Хаара, б) 2х-мерные вейвлет Мейера, в) вейвлет Мексиканская Шляпа, г) вейвлет Добеши. Рисунок 7 – Задача поиска блика в глазу с помощью вейвлет-анализа. д) Корреляция цифровых изображений. Так же стоит рассказать про корреляцию цифровых изображений. Для фильтрации изображений это незаменимый инструмент. Корреляция цифровых изображений (англ. Digital Image Correlation and Tracking, (DIC/DDIT)) — оптический метод, используемый в техниках отслеживания и идентификации изображения для точных плоских и объемных измерений изменений на изображении. Этот метод часто используется не только для измерения деформаций, полей перемещений и оптических потоков, но и широко используется во многих областях науки и инженерного ремесла. Одно из наиболее широко известных применений данного метода — идентификация перемещений оптической мышки. Классическое применение — корреляция видеопотока для нахождения сдвигов или оптических потоков. Простейший детектор сдвига — тоже в каком-то смысле разностный коррелятор. Там, где изображения не коррелируют — было движение (рисунок 8). Рисунок 8 – Пример корреляции цифрового изображения е) Фильтрации функций Одним из самых интересных классов фильтров является фильтрация функций. Суть в том, что эти фильтры являются математическими, и позволяют обнаружить самую простую математическую функцию на области распознавания, такую как например прямая, парабола или круг. Принцип этого фильтра заключается в построении аккумулирующего изображения, в котором для каждой точки исходного изображения прорисовывается множество функций, которые е? образовали. Наиболее классическим преобразованием является преобразование Хафа для прямых. Преобразование Хафа (Hough Transform) — алгоритм, численный метод, применяемый для извлечения элементов из изображения (патент 1962 г. Поля Хафа). Используется в анализе изображений, цифровой обработке изображений и компьютерном зрении. Предназначен для поиска объектов, принадлежащих определ?нному классу фигур, с использованием процедуры голосования. Процедура голосования применяется к пространству параметров, из которого и получаются объекты определ?нного класса фигур по локальному максимуму в так называемом накопительном пространстве (accumulator space), которое строится при вычислении трансформации Хафа. Классический алгоритм преобразования Хафа связан с идентификацией прямых в изображении В этом преобразовании для каждой точки (x;y) прорисовывается множество точек (a;b) прямой y=ax+b, для которых верно равенство (рисунок 9) Рисунок 9 – Преобразование Хафа. Преобразование Хафа позволяет находить любые функции, основанные на параметрах. Например, окружности. Так же существует и модифицированное преобразование, позволяющее искать совершенно любые фигуры. Данное преобразование очень полюбилось математикам. Однако при обработке изображений, оно, к сожалению, работает далеко не всегда, в связи с присущей ему крайне медленной скоростью работы и очень высокой чувствительностью к качеству бинеризации. Даже в идеальных ситуациях предпочтительно использовать другими методами. Аналогом преобразования Хафа для прямых является преобразование Радона. Преобразование Радона рассчитывается по быстрому преобразованию Фурье, что позволяет выиграть в производительности при ситуации, когда точек очень много. К тому же его возможно применять к не бинаризованному изображению. Преобразование Радона — интегральное преобразование функции многих переменных, родственное преобразованию Фурье. Впервые введено в работе австрийского математика Иоганна Радона 1917-го года. Важнейшее свойство преобразования Радона — обратимость, то есть возможность восстанавливать исходную функцию по е? преобразованию Радона. ж) Фильтрации контуров Отдельный класс фильтров — это фильтрация границ и контуров. Фильтрация контуров можем быть очень полезна, если нужно перейти от работы с самим изображением к работе с объектами на этом изображении. В случаях, когда объект сложный, но хорошо выделяемый, очень часто лучшим методом работы с ним является именно выделение его контуров. Существует целый ряд алгоритмов, решающих задачу фильтрации контуров: * Оператор Кэнни * Оператор Собеля * Оператор Лапласа * Оператор Прюитт * Оператор Робертса Выше приведены фильтры, которые могу решить большую часть задач по распознаванию границ. Однако кроме них существует множество более редких фильтров, которые используют в более специфических задачахпоэтомув описании каждого из них просто нет смысла. Однако чаще всего применяют именно оператор Кэнни, который хорошо работает, и реализация которого есть в OpenCV поэтому про него рассказать стоит. Оператор Кэнни (детектор границ Кэнни, алгоритм Кэнни) в дисциплине компьютерного зрения — оператор обнаружения границ изображения. Был разработан в 1986 году Джоном Кэнни (англ. John F. Canny) и использует многоступенчатый алгоритм для обнаружения широкого спектра границ в изображениях. Кэнни изучил математическую проблему получения фильтра, оптимального по критериям выделения, локализации и минимизации нескольких откликов одного края. Он показал, что искомый фильтр является суммой четыр?х экспонент. Он также показал, что этот фильтр может быть хорошо приближен первой производной Гауссианы. Кэнни вв?л понятие подавления не максимумов (англ. Non-Maximum Suppression), которое означает, что пикселями границ объявляются пиксели, в которых достигается локальный максимум градиента в направлении вектора градиента. Алгоритм состоит из пяти отдельных шагов: * Сглаживание. Размытие изображения для удаления шума. * Поиск градиентов. Границы отмечаются там, где градиент изображения приобретает максимальное значение. * Подавление не-максимумов. Только локальные максимумы отмечаются как границы. * Двойная пороговая фильтрация. Потенциальные границы определяются порогами. * Трассировка области неоднозначности. Итоговые границы определяются пут?м подавления всех кра?в, несвязанных с определенными (сильными) границами. Перед применением детектора, изображение обычно преобразуют в оттенки серого, чтобы уменьшить вычислительные затраты. Этот этап характерен для многих методов обработки изображений. Интересными являются итерационные фильтры (например, активная модель внешнего вида), а также риджлет и курвлет преобразования, являющиеся сплавом классической вейвлет фильтрации и анализом в поле радон-преобразования. Бимлет-преобразование красиво работает на границе вейвлет преобразования и логического анализа, позволяя выделить контуры. Но эти преобразования весьма специфичны и заточены под редкие задачи. 1.1.2.Логическая обработка результатов фильтрации Фильтрация даёт набор пригодных для обработки данных. Но зачастую нельзя просто взять и использовать эти данные без их обработки. В этом разделе будет несколько классических методов, позволяющих перейти от изображения к свойствам объектов, или к самим объектам. а) Математическая морфология В бинарной морфологии двоичное изображение, представленное в виде упорядоченного набора (упорядоченного множества) чёрно-белых точек (пикселей), или 0 и 1. Под областью изображения обычно понимается некоторое подмножество точек изображения. Каждая операция двоичной морфологии является некоторым преобразованием этого множества. В качестве исходных данных принимаются двоичное изображение B и некоторый структурный элемент S. Результатом операции также является двоичное изображение. Классическое описание операций бинарной математической морфологии было дано в терминах теории множеств, оперирующей такими понятиями, как объединение множеств, пересечение множеств и отношение включения. При этом бинарные изображения рассматриваются непосредственно как множества пикселов, поэтому соответствующие теоретико-множественные операции имеют очевидную наглядную интерпретацию в духе "кругов Эйлера" (Рисунок 10). Рисунок 10 – Общее представление о кругах (диаграмме) Эйлера В первую очередь математическая морфология используется для извлечения некоторых свойств изображения, полезных для его представления и описания. Например, контуров, остовов, выпуклых оболочек. Также интерес представляют морфологические методы, применяемые на этапах предварительной и итоговой обработки изображений. Например, морфологическая фильтрация, утолщение или утоньшение. Входными данными для аппарата математической морфологии являются два изображения: обрабатываемое и специальное, зависящее от вида операции и решаемой задачи. Такое специальное изображения принято называть примитивом или структурным элементом. Как правило, структурный элемент много меньше обрабатываемого изображения. Структурный элемент можно считать описание области с некоторой формой. Понятно, что форма может быть любой, главное, чтобы е? можно было представить в виде бинарного изображения заданного размера. Во многих пакетах обработки изображений наиболее распространенные структурные элементы имеют специальные названия: BOX[H,W] – прямоугольник заданного размера, DISK[R] — диск заданного размера, RING[R] – кольцо заданного размера. (Рисунок 11 а) б) в) Рисунок 11 Структурные элементы а) BOX б) DISK в) RING Результат морфологической обработки зависит как от размера и конфигурации исходного изображения, так и от структурного примитива. Размер структурного элемента как правило равен 3*3, 4*4 или 5*5 пикселов. Это обусловлено главной идеей морфологической обработки, в процессе которой отыскиваются характерные детали изображения. Искомая деталь описывается примитивом, и в результате морфологической обработки можно подчеркнуть или удалить такие детали на вс?м изображении. Одно из основных преимуществ морфологической обработки –е? простота: как на входе, так и на выходе процедуры обработки мы получаем бинаризованное изображение. Другие методы, как правило, из исходного изображения сначала получают полутоновое, которое затем приводится к бинарному с помощью пороговой функции. б) Контурный анализ В разделе по фильтрации уже упоминались алгоритмы получения границ. Полученные границы достаточно просто преобразуются в контуры. Для алгоритма Кэнни это происходит автоматически, для остальных алгоритмов требуется дополнительная бинаризация. Получить контур для бинарного алгоритма можно, например, «алгоритмом жука». Контур является уникальной характеристикой объекта. Часто это позволяет идентифицировать объект по контуру. Существует мощный математический аппарат, позволяющий это сделать. Аппарат называется контурным анализом в) Особые точки Особые точки — это уникальные характеристики объекта, которые позволяют сопоставлять объект сам с собой или с похожими классами объектов. Существует несколько десятков способов, позволяющих выделить такие точки. Некоторые способы выделяют особые точки в соседних кадрах, некоторые через большой промежуток времени и при смене освещения, некоторые позволяют найти особые точки, которые остаются таковыми даже при поворотах объекта. Начнём с методов, позволяющих найти особые точки, которые не такие стабильные, зато быстро рассчитываются, а потом пойдём по возрастанию сложности: Первый класс. Особые точки, являющиеся стабильными на протяжении секунд. Такие точки служат для того, чтобы вести объект между соседними кадрами видео, или для сведения изображения с соседних камер. К таким точкам можно отнести локальные максимумы изображения, углы на изображении (лучший из детекторов, пожалуй, детектор Хариса), точки в которых достигается максимумы дисперсии, определ?нные градиенты и.т.д. Второй класс. Особые точки, являющиеся стабильными при смене освещения и небольших движениях объекта. Такие точки служат в первую очередь для обучения и последующей классификации типов объектов. Например, классификатор пешехода или классификатор лица — это продукт системы, построенной именно на таких точках. Некоторые из ранее упомянутых вейвлетов могут являются базой для таких точек. Например, примитивы Хаара, поиск бликов, поиск прочих специфических функций. К таким точкам относятся точки, найденные методом гистограмм направленных градиентов (HOG). Третий класс. Стабильные точки. Два основных метода - SURF и SIFT. Они позволяют находить особые точки даже при повороте изображения. Расч?т таких точек осуществляется дольше по сравнению с остальными методами, но достаточно ограниченное время. Эти методы запатентованы эти методы запатентованы. 1.1.3. Обучение Третья часть посвящена методам, которые не работают непосредственно с изображением, но которые позволяют принимать решения. В основном это различные методы машинного обучения и принятия решений. В 80% ситуаций суть обучения в задаче распознавания в следующем: Имеется тестовая выборка, на которой есть несколько классов объектов. Пусть это будет наличие/отсутствие человека на фотографии. Для каждого изображения есть набор признаков, которые были выделены каким-нибудь признаком, будь то Хаар, HOG, SURF или какой-нибудь вейвлет. Алгоритм обучения должен построить такую модель, по которой он сумеет проанализировать новое изображение и принять решение, какой из объектов имеется на изображении. Каждое из тестовых изображений — это точка в пространстве признаков. Е? координаты - это вес каждого из признаков на изображении. Пусть нашими признаками будут: «Наличие глаз», «Наличие носа», «Наличие двух рук», «Наличие ушей», и.т.д. Все эти признаки мы выделим существующими у нас детекторами, которые обучены на части тела, похожие на людские. Для человека в таком пространстве будет корректной точка [1;1;1;1;..]. Для обезьяны точка [1;0;1;0...] для лошади [1;0;0;0...]. Классификатор обучается по выборке примеров. Но не на всех фотографиях выделились руки, на других нет глаз, а на третьей у обезьяны из-за ошибки классификатора появился человеческий нос. Обучаемый классификатор человека автоматически разбивает пространство признаков таким образом, чтобы сказать: если первый признак лежит в диапазоне 0.5 |
Для получения полной версии работы нажмите на кнопку "Узнать цену"
Узнать цену | Каталог работ |
Похожие работы:
- Теоретическое обоснование изучения проблемы обеспечения информационной безопасности предприятия
- Обоснование стратегии, направления и инструментов обеспечения продовольственной безопасности РФ в условиях негативного экономического влияния на государство
- Анализ системы обеспечения экономической безопасности коммерческого банка