Open Library - открытая библиотека учебной информации

Открытая библиотека для школьников и студентов. Лекции, конспекты и учебные материалы по всем научным направлениям.

Категории

Высокие технологии Алгоритм бустинга для построения детектора
просмотров - 152

Основная идея бустинга заключается в создании сильного классификатора из набора слабых классификаторов используя аддитивную модель (2) путем минимзации экспоненциальной фунции ошибки (3). На каждой итерации алгоритма бустинга, примеры из тренировочного набора которые были классифицированы корректно получают меньший весовой коэффициент , а те, которые часто классифицировались неправильно, получают больший вес . Из формулы (3) видно, что если результат классификации детектором совпадает по знаку с фактическим наличием микрочастицы на изображении, то функция ошибки минимизируется.

(2)

(3)

где - слабые классификаторы, - сильный классификатор, - тренировочные изображения, - объект или фон представлен на тренировочном изображении , - количество тренировочных изображений.

Существует множество вариаций бустинга, в данной работе мы остановились на версии алгоритма GentleBoost, который можно описать следующим образом:

1. Инициализация: веса для каждого тренировочного примера задаются равными друг другу

2. На каждой итерации алгоритма

2.1. Выбрать оптимальный слабый классификатор и параметры ступенчатой функции слабого классификатора которые решают взвешенную задачу наименьших квадратов:

2.2. Определить оптимальный слабый классификатор в форме регрессионной ступенчатой функции из предыдущего шага:

2.3. Обновить сильный классификатор:

2.4. Обновить веса для примеров, веса неверно классифицированных примеров увеличиваются, а веса верно классифицированных примеров уменьшаются. Это требуется для того чтобы следующий слабый детектор был выбран более специализированным именно под неверно классифицированные примеры:

3. Определить сильный классификатор в виде:

На Рис.4 можно видеть, как изменяются ROC-кривые детектора. ROC-кривая (операционная характеристика приемника) - зависимость процента корректных позитивных срабатываний детектора (микрочастица присутствует на изображении и детектор подтверждает это) от процента ложных позитивных срабатываний (частица отсутствует на изображении, но детектор определяет микрочастицу).

Рис.4 ROC-кривые для классификатора на основе бустинга с разым количеством слабых детекторов (слева), сравнение ROC-кривых классификатора на основе бустинга с классификатором на основе метода главных компонент (справа)

Одним из базовых преимуществ бустинг алгоритмов относительно других методов построения классификаторов является то, что они практически невоспреимчивы к перетренированности. Чем больше итераций бустинга мы используем, ᴛ.ᴇ. чем больше порядок классификатора, тем лучше получаются результаты не только на тренировочном, но и на контрольном множестве примеров. Также из Рис.4 слева видно, что точность детектирования улучшается с увеличением количество слабых детекторов (итераций бустинга) в сильном детекторе.

Как видно из Рис.4 справа, ROC-кривая, соответствующая детектору построенному с помощью бустинга, имеет значительно более высокий процент детектирования при значительно меньшем количестве ложных срабатываний, чем кривые для детектора на основе метода главных компонент. Остается открытым вопрос, почему детектор на основе метода главных компонент работает несколько лучше при малой частоте ложных срабатываний.[тут большая картинка с найденными шарами]