Главная > Распознавание образов > Лекции по теории образов: Анализ образов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 5. Образы-множества и статистическая геометрия

5.1. Единственные образующие

В данной главе образующие мы будем задавать в виде некоторых подмножеств опорного пространства с группами преобразований подобия или . Примеры комбинаторных правил подходящих для образов-множеств, можно найти в разд. 3.5, т. 1.

В большинстве разделов данной главы правило идентификации мы будем выбирать так, чтобы идентификация множеств осуществлялась при помощи пересечений образующих или путем распространения этого принципа на логику признаков высшего порядка или другие логические функции.

Что касается деформаций, то мы рассмотрим несколько их типов. Первый — это выборочные деформации, введенные в случае 4.5.3 т. 1: точек идеального изображения отбираются при помощи простой случайной выборки из равномерного распределения, заданного на Естественно, для того чтобы это имело смысл, необходимо выполнение условия где лебегова мера. В качестве ошибки восстановления будем использовать площадь симметрической разности между идеальным и восстановленным изображениями соответственно.

Второй механизм деформации был введен при рассмотрении случая 4.5.2 т. 1; деформированное изображение состоит из точек, порожденных однородным пуассоновским процессом с постоянной интенсивностью X (только в пределах

Третий механизм деформации представляет собой одну из разновидностей механизма случая 4.5.2 т. 1: здесь интенсивность пуассоновского потока равна в пределах вне Для всех трех механизмов деформаций окно представляет собой дискретное множество точек, порожденных некоторым случайным, но зависящим от идеального изображения способом.

После такого вступления мы готовы сформулировать задачу, которой будем заниматься в данной главе.

Статистическая геометрия: вывести образ по результатам наблюдения деформированного геометрического изображения

Существенным элементом этой задачи является не только восстановление идеального изображения, но, кроме этого, определение преобразований подобия в классе образов, порожденном

некоторым прототипом, определение индексов класса образующих, входящих в соответствующие конфигурации, и множество иных задач. Чтобы восстанавливать изображение методом максимума правдоподобия, будем действовать следующим образом. Рассмотрим большую квадратную область и вычислим с помощью теоремы 1.2.1 производную Радона—Никодима

При приходим к элементарному соотношению

так что восстановление по методу максимального правдоподобия оказывается эквивалентным решению уравнения

т. е. мы ищем наименьшее идеальное изображение, содержащее деформированное.

Случай требует несколько больших усилий. Воспользуемся теоремой 1.2.1; см. также статью Гренандера (1950), с. 225. Покроем область равномерной сетью квадратов и введем показатель, характеризующий число объектов, принадлежащих непересекающимся подквадратам:

Тогда при воздействии механизма деформации все случайные Величины независимы и характеризуются распределением Пуассона. Следовательно, мы получаем производную Радона—Никодима

где площадь каждого подквадрата и площадь Пересечения подквадрата и идеального изображения Поэтому указанную производную можно записать в следующем виде:

При стремлении к бесконечности все подквадраты станут пустыми, за исключением подквадратов, соответствующих точкам, Входящим в деформированное изображение Следовательно,

предел выражения (5.1.6) дает производную Радона—Никодима

Таким образом, восстановление по методу максимального правдоподобия все еще эквивалентно решению задачи минимизации (5.1.3).

И наконец, для случая мы с помощью аналогичных рассуждений получаем производную Радона—Никодима

в результате нам предстоит решить задачу отыскания максимума:

Итак, нами доказана следующая теорема.

Теорема 5.1.1. При наличии механизмов деформации восстановление по методу максимального правдоподобия обеспечивается решением уравнения (5.1.3) в случае и и уравнения (5.1.9) в случае

Отметим, что все эти деформации гетероморфные и деформированное изображение количественно отличается от идеального Они, кроме того, ковариантны по вероятности.

Реализация соответствующих алгоритмов может оказаться неудобной в вычислительном отношении, и нам придется искать иные, более удобные методы. Все три механизма деформации вполне аналогичны друг другу, и ниже мы займемся первым из них.

Кроме этих трех механизмов деформации нам будет встречаться и четвертый когда мы будем заниматься множествами, идентифицируемыми с помощью правила представляющего пересечения объединений образующих. Другими словами, здесь мы работаем с логикой признаков множеств. Из указанных образующих случайно выбираются , и результат идентифицируется снова с помощью пересечения. Эта процедура определяет деформированное изображение если установлен механизм случайного выбора.

Мы начнем анализ с простого случая — одноатомной конфигурации, т. е., конфигурации, включающей лишь одну образующую.

Пусть множество образующих включает только диски радиус и координаты центра диска. Всякому значению радиуса соответствует класс образов, порожденный из прототипа .

Для того чтобы вывести образ при заданном центре, необходимо оценить всего один действительный параметр Если вернуться к восстановлению по методу максимального правдоподобия,

то мы просто должны найти

Сейчас нас интересуют методы, которые можно было бы без соответствующих вычислительных затруднений распространить на менее тривиальные алгебры изображений, и в связи с этим обратимся к следующей альтернативе.

Рис. 5.1.1.

Рассмотрим случай, представленный на рис. 5.1.1. В единичном круге С содержатся точек, имеющих распределение, определяемое выборкой из равномерного распределения, заданного на С. Центр круга С расположен в начале координат, а упомянутые точки обозначены через . Введем четыре случайные переменные:

Для начала мы хотели бы найти их функцию совместного распределения. Очевидно, что при увеличении и случайные переменные будут стремиться к и — к 1. Поэтому мы

нормируем их так:

конкретный вид нормировки, т. е. показатель степени а, будет определен позже. Переменные и будут подвергнуты аналогичным преобразованиям.

Рассмотрим функцию от и и

Обозначим площадь правого заштрихованного сегмента на рис. 5.1.1 через причем Тогда

где V — половина центрального угла и, следовательно,

Далее, учитывая оба заштрихованных сегмента, получаем, что

Заметим, однако, что при малых значениях из уравнения (5.1.15) асимптотически следует

и

Следовательно, выражение в (5.1.16), стоящее в квадратных скобках, включая множитель можно асимптотически представить как

Теперь из вида выражения (5.1.19) следует, что это то значение, которое обеспечит невырожденный предельный результат. Тогда получаем

Следовательно, случайные величины и и асимптотически независимы и характеризуются функцией распределения вейбулловского типа

и плотностью распределения вероятностей

Введем теперь эмпирический первый диаметр

распределение вероятностей которого явно инвариантно по отношению к переносам, и случайную переменную

Очевидно, что асимптотически случайная переменная характеризуется плотностью распределения вероятностей с соответствующей функцией распределения и потому результирующее распределение определяется выражением

Полученные результаты относятся к первому эмпирическому диаметру в направлении То же самое можно проделать и для второго эмпирического диаметра в направлении у, и нетрудно убедиться в том, что они асимптотически независимы. Эти результаты можно непосредственно обобщить на случай диаметров с заданными различными направлениями из этого следует, что при фиксированном

Теперь мы перейдем к оценке неизвестного радиуса круга наблюдениям эмпирических диаметров

«ирические диаметры обладают тем же асимптотическим распределением, что но с измененным масштабом в отношении поэтому можно обратиться к выражению (5.1.25), чтобы получить статистическую оценку которая является асимптотически несмещенной оценкой медианы. Итак, нами доказана следующая теорема.

Теорема 5.1.2. Статистическая оценка, получаемая по диаметрам:

является асимптотически несмещенной оценкой медианы, если выбирается так, оно удовлетворяет уравнению

причем доверительлый интервал —

и доверительный уровень —

Необходимо сделать одну оговорку относительно интерпретации и применения этой теоремы. Заманчиво выбирать большим: если получать оценку по большому числу диаметров, то, вероятно, она будет более эффективной. Это действительно так, но следует учитывать то обстоятельство, что при получении асимптотического результата мы пользовались малой вероятностью перекрытия соответствующих сегментов при больших выборках. Для любого значения перекрытие можно исключить, если Если же одновременно увеличивать то данное утверждение, а следовательно, и соответствующие результаты (5.1.27) и (5.1.30) перестают быть справедливыми. В связи с этим для следует выбирать скорее небольшие значения, скажем 4 или 6, если имеет порядок 50—100.

Нам уже известно, что размер множества дрейфа может уменьшаться (см. теорему 4.5.5, т. 1). Теперь перейдем ко второму этапу идентификации изображения и попытаемся оценить

с помощью оценок базирующихся на диаметрах множества направлений

Обозначим через и минимум и максимум соответственно, измеренные по направлению Используя те же, что и выше, обозначения, получаем

В данном случае мы воспользуемся их средним:

где Из предыдущего известно, что для всякого множества значений

асимптотически независимы, причем каждое из них характеризуется функцией распределения

где обозначает функцию распределения — и. Отметим, что является симметризацией Н и потому - нечетная функция. Математическое ожидание разумеется, равно нулю, а дисперсия

Для идентификации (и аналогично ) воспользуемся линейной комбинацией средних значений

Согласно требованию несмещенности,

в то время как дисперсия большой выборки равна

Допустим, что направлений размещены равномерно:

Учитывая, что , получаем

эти соотношения можно использовать для определения доверительных интервалов для

Выражения (5.1.40) заслуживают нескольких дополнительных замечаний. Замена деформированного изображения признаками была осуществлена с помощью граничных признаков деформированного изображения величин, полученных на Основе и и их линейной комбинации. Мы воспользовались квазилинейной процедурой выделения признаков.

Если бы вместо этого мы воспользовались линейными признаками т. е. коордйнатами центра тяжести деформированного изображения то дисперсия была бы порядка Отдав предпочтение квазилинейным граничным признакам, мы добились увеличения точности восстановления на величину порядка

Если бы мы применяли теорему 5.1.1 непосредственно произвольному кругу, то пришлось бы отыскивать круг наименьшего радиуса содержащий множество точек Полный перебор в этом случае практически невозможен, за исключением вариантов с очень малыми значениями . В самом деле, круг должен проходить по меньшей мере через две точки и если это число точек действительно равно двум, то это противоположные точки диаметра . В связи с этим необходимо просчитать кругов. Если, с другой стороны, круг проходит по меньшей мере через три точки что определяет

то необходимо просчитывать кругов, проверяя для каждого круга, покрывает ли он и выбирая наименьший из таких кругов.

В статье Басса и Шуберта (1967) предложен более удачный алгоритм, в основе которого лежат следующие соображения. Если диаметр равен то радиус снизу ограничен величиной а сверху Первое очевидно. Докажем второе. Пусть круг радиуса в который вписан равносторонний треугольник со стороной . В таком случае где диаметр множества вершин треугольника. Рассмотрим теперь некоторое другое множество диаметра включающее три другие точки на которые не образуют равносторонний треугольник. В таком случае , что и требовалось доказать.

Алгоритм. Шаг 1. Формируем выпуклую оболочку деформированного изображения и множество его экстремальных точек эффективная процедура для выполнения этого шага приведена в следующем разделе.

Шаг 2. Определяем диаметр Н путем вычисления расстояний между всеми парами точек Е и выбора наибольшего из них.

Шаг 3. Проверяем, покрывает ли круг с этим диаметром (возможно, несколько кругов) деформированное изображение Если да, то работа алгоритма закончена.

Шаг 4. В противном случае формируются круги проходящие через три экстремальные точки Е. Круги, для которых выполняется неравенство , при увеличении подвергаются проверке: покрывают ли они из тех, которые покрывают, выбирается круг с наименьшим

Данный алгоритм представляет собой явное улучшение по сравнению с "лобовым" алгоритмом, но тем не менее необходимые затраты машинного времени при больших значениях будут ощутимыми. Более совершенный алгоритм описан в работе Шамоса (1975).

Случай, когда алгебра изображений включает только круги, является, конечно, очень частным. Давайте поэтому обратимся к случаю, когда класс образов порождается для всех причем прототип V представляет собой некоторую замкнутую выпуклую фигуру непрерывной кривизны. Если бы мы допустили существование углов, то описываемый ниже анализ пришлось бы модифицировать, но обсуждение того, как это сделать, мы пока отложим. Начнем со случая, когда изменения масштаба, и следовательно, требуется идентифицировать коэффициент изменения масштаба, скажем Пусть площадь V равна А.

Рассмотрим рис. 5.1.2, где — две опорные прямые с направлением Обозначим радиусы кривизны в точках касания через соответственно. Введем координатную ось перпендикулярную направлению

Рис. 5.1.2.

Для деформированного изображения введем показатели аналогичные величинам, введенным при рассмотрении круга (см. рис. 5.1.1). Тогда можно записать

где коэффициенты характеризуют размер малого сегмента точках касания т. е.

Величину

можно представить как

Объединяя таких значений в некоторый новый признак

выбираем коэффициенты так, чтобы выполнялось

где математическое ожидание распределения Н и

(Смысл здесь очевиден.) Отсюда непосредственно получаем, что

а дисперсия нового признака равна в результате

При рассмотрении круга не возникала задача, которая встает для данного прототипа V, когда преобразования подобия группа вращений. Пусть масштаб и положение идеального изображения определены (мы будем пользоваться обозначениями, введенными в связи с рис. 5.1.2). Неизвестный угол поворота обозначим через . В таком случае все значений множества

асимптотически независимы и характеризуются распределением Н с математическим ожиданием Поэтому естественно оценивать путем решения задачи наименьших квадратов:

Это нелинейная задача наименьших квадратов, но для получения асимптотического решения достаточно линеаризовать функции от в, входящие в выражения для Здесь предполагается, что значений однозначно определяют угол .

Рис. 5.1.3.

Теперь можно перейти к более богатой алгебре изображений Пусть прототипом снова служит единичный диск, а преобразования подобия S = {переносы, изменения масштаба}. Если правило идентифицирует объединения образующих то получатся изображения, подобные приведенному на рис. 5.1.3, а. Если для любого изображения допускаются только два прототипа, то возникает шестимерная алгебра изображений: четыре измерения для центров

и два — для радиусов. Специализированная процедура идентификации, основанная на использовании центра тяжести и моментов инерции, в данном случае работать не будет.

Можно, однако, положить в основу идентификации статистики граничных значений, распространив на данный случай уже применявшийся нами подход. Эта методология применима, если принять во внимание частный случай, возникающий при приближении к по одной из двух общих для обоих кругов касательных. Сделав это, мы получим вместо одного два вклада в распределение показателей и две точки соприкосновения касательной с

Если же вместо этого правило идентифицирует пересечения образующих и их дополнений, то получатся серповидные изображения типа приведенного на рис. 5.1.3, б. В данном случае нашу методологию следует расширить так, чтобы она позволяла работать с изображениями, в которых присутствуют углы.

Рис. 5.1.4.

Рассмотрим в связи с этим вершину, представленную на рис. 5.1.4 и имеющую центральный угол Теперь мы приближаемся к по направлению которое здесь удобнее задать (см. рис. 5.1.4). Обозначив полную площадь через получаем для вероятности попадания точки, выбранной в I случайным образом, в область, расположенную слева от следующее выражение:

это выражение справедливо асимптотически для небольших значений при условии непрерывной кривизны вне вершины. Теперь становится ясно, как следует нормировать Пусть

что приводит к следующей асимптотической функции распределения для :

Такое полунормальное распределение можно использовать для обработки изображений с углами вместо -распределения, которое годится для случая гладких границ. Более подробно с возможностями использования точек разрыва на границах можно познакомиться по статье Гренандера (1973а), с. 842—846.

При переходе к более богатым алгебрам изображений, сформированным аналогично при больших можно в принципе применять этот же метод. Для алгебр изображений высших размерностей это, однако, уже не кажется столь же естественным, и потому предпочтение отдается более непараметрическим методам. Что касается парактики, то уже при шестимерных серповидных изображениях может возникнуть такая ситуация. Рассмотрим несколько альтернативных процедур идентификации.

Начнем с алгебры Сформируем выпуклую оболочку Р (см. рис. 5.1.5) и обозначим длины сторон через их ориентации через Рассмотрим концевые точки стороны с наибольшей длиной и введем круги радиуса проходящие через точки .

Построим изображение вида

и выбираем так, чтобы обеспечить с учетом ограничения Можно доказать, что это состоятельная оценка идеального изображения .

Рис. 5.1.5.

Еще одна статистика граничного показателя, которую можно было бы использовать, — это множество значений

Это оценки кривизны, и их можно использовать как для оценивания обратных величин так и для определения положения центров обоих кругов.

Анализ, изложенный в данном разделе, базируется в основном на статистиках граничных показателей. Строго говоря, не имеет нетривиальной границы, так как оно является просто дискретным точечным множеством. Мы ввели функции от деформированного изображения они аппроксимируют соответствующие функции от Эти функции представляют свойства границы или производных величин типа диаметров.

Рассмотренные статистики граничных показателей ковариантны по вероятности (см. разд. 1.2) и легко поддаются вычислению. Так, например, для определения в (5.1.11) достаточно найти точку № с минимальным значением координаты Это можно

сделать с помощью всего лишь сравнения. Восстановление по методу максимального правдоподобия, которое с теоретической точки зрения выглядит предпочтительнее, в общем случае оказывается менее привлекательным в вычислительном смысле.

Естественным продолжением изложенного является переход к алгебрам изображений с более чем одним прототипом, например кругами и квадратами. При этом статистики граничных показателей будут, судя по всему, естественным инструментом, однако этот вопрос еще не изучен.

<< Предыдущий параграф Следующий параграф >>
Оглавление