Главная > Распознавание образов > Селекция и распознавание на основе локационной информации
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.9. НЕПАРАМЕТРИЧЕСКИЕ ПРОЦЕДУРЫ РАСПОЗНАВАНИЯ ГРУПП ОБЪЕКТОВ

Рассматриваемые алгоритмы сходны с непараметрическими процедурами обнаружения сигналов, теория которых сейчас интенсивно развивается. Основные отличия между теми и другими заключается в том, что, во-первых, задача распознавания решается при числе альтернатив М, большем двух, и, во-вторых, анализ сигналов, приходящих из различных участков пространства (на разных частотах), заменен анализом признаков, характеризующих каждый объект распознаваемой группы.

В практике РРЦ группы наблюдаемых объектов весьма часто будут иметь однородный состав. Сказанное означает, что все объектов группы будут принадлежать к одному классу , или даже виду но неизвестно, к какому именно. В этом случае определение факта однородности группы может очень существенно

оказаться на вероятности принятия правильных (решений. В этом легко убедиться, если предположить, что в однородные группы размера N могут объединяться радиолокационные цели не всех видов или классов. Кроме того, к однородным группам могут быть применены наиболее эффективные в таких условиях разновидности одношаговых адаптивных алгоритмов или правила принятия составных решений.

Установление факта однородности группы может иметь и важное самостоятельное значение, связанное со способом действий потребителя информации. Так, в примере, разобранном в § 9.1, однородная группа заведомо включает два объекта третьего класса и, стало быть, обслуживанию не подлежит.

Таким образом, в перечень задач, решаемых при РРЦ, можно включить и оценку гипотезы об однородности состава группы обнаруженных объектов. Специфика рассматриваемых далее непараметрических алгоритмов такова, что именно эту задачу можно с их помощью решить наиболее эффективно.

Для принятия решения об однородности наблюдаемой группы следует сконструировать какую-либо меру сходства ее с группами из множества однородных. В идеальном случае в качестве такой меры сходства должна использоваться вероятность гипотезы

где — априорные вероятности предъявления групп однородного (индекс О) или неоднородного (индекс Н) составов; — соответствующие условные законы распределения вероятностей множества признаков характеризующих объекты группы Если законы распределения вероятностей признаков для объектов каждого класса заданы точно, то расчет функций а следовательно и вероятности принципиально возможен.

Рассматриваемые далее непараметрические процедуры позволяют оценить функцию и тогда, когда о законах почти ничего не известно, кроме того, что при . К сожалению, в общем случае расчет значений функций при таких скудных априорных сведениях невозможен. Это приводит к необходимости использовать приближенные оценки вероятности или косвенно связанные с ней показатели, например коэффициенты ранговой корреляции Чупрова, Кендэла или коэффициент конкордации [50, 49]. Каждая из этих мер, наряду с вероятностью может служить оценкой доли одинаковых объектов в группе с последующим применением адаптивных решающих правил (см. п. 6.7.1).

В практике радиолокационного распознавания одинаково редко встречаются случаи как полностью известных, так и полностью неизвестных статистических описаний классов. Поэтому зачастую приближенное задание законов позволяет приближенно же

найти функции что необходимо для синтеза правил распознавания однородных групп объектов. Иногда для этого удается использовать сведения о законах формирования групп.

С помощью аппарата распознавания однородных групп можно разбить наблюдаемую группу объектов на несколько подгрупп каждая из которых имеет однородный состав. В этом случае привлечение небольшого объема дополнительных априорных данных о характеристиках классов позволит отнести к одному из них каждую однородную подгруппу Такими дополнительными данными могут служить сведения о возможном числе объектов разных классов в группах, соотношении их средних ЭПР и т.

Проанализируем более подробно непараметрические процедуры, которые используют для распознавания групп радиолокационных целей. Среди них различают три разновидности алгоритмов: основанные на использовании статистических критериев согласия, ранговые и кластеризации. Рассмотрим последовательно каждый из них.

Алгоритмы, основанные на использовании статистических критериев согласий. Допустим, что у наблюдателя нет никаких достоверных сведений о распознаваемых классах, кроме информации о том, что их статистические характеристики не совпадают: Сформулируем две взаимоисключающие гипотезы: — все объекты рассматриваемой группы принадлежат к одному и тому же классу; — в группе представлены объекты разных классов.

Правдоподобие первой гипотезы можно оценить с помощью хорошо известных непараметрических критериев согласия: Пирсона, Мизеса, Колмогорова и др. [54, 63]. Для примера остановимся на одном из них — часто применяемом в статистике критерии Пирсона

Допустим, что для каждого объекта группы измерены по отсчетов признака Это позволяет построить гистограмму значений признака характеризующую данную радиолокационную цель. Для этого необходимо весь диапазон значений признака разбить на разрядов с номерами и оценить частоту попаданий значений признака в каждый из них. Если у всех объектов группы эти частоты будут близки то ее состав может быть признан однородным.

Статистика Пирсона учитывает отклонения частот от средних значений

(для удобства в обозначениях индекс заменен индексами ).

Если гипотеза об однородности группы справедлива, то закон распределения статистики при условии, что отношения достаточно велики, имеет распределение степенями свободы

где — гамма-функция.

При этом математическое ожидание статистики

где .

Выберем некоторое пороговое значение и будем относить к классу все группы, для которых а остальные группы отнесем к множеству групп неоднородного состава При этом, подбирая порог можно обеспечить любую наперед заданную вероятность неверного распознавания однородных групп радиолокационных целей. К сожалению, оценить вероятность ошибки второго рода К, т. е. вероятность отнести группу смешанного состава к разряду однородных, довольно трудно, если функции не заданы. Лучшее, что иногда удается сделать в этой ситуации, — это рассчитать ее предельное значение. Укажем на один из способов получения такой оценки.

Пусть распределение одномодальное и имеет вид, показанный на рис. 6.14. Произвольному значению функции попавшему слева от порога соответствует вероятность гипотезы

Рис. 6.14

Предположим, что при всех значение функции не превосходит некоторого предела Тогда

Поскольку, отвергая гипотезу мы ошибаемся с вероятностью можно утверждать, что рассмотренный алгоритм будет характеризоваться вероятностью ошибки распознавания однородных групп и вероятностью ошибки второго рода

при условии, что для всех

Если положить то можно записать

Полученный результат остается справедливым и для других непараметрических статистик, не совпадающих со статистикой Пирсона. Так, если распределения такой статистики (обозначим ее через дискретны, то параметр не может быть больше единицы.

Ранговые алгоритмы распознавания групп объектов. Проанализируем значения признаков измеренных после обращения к каждому объекту наблюдаемой группы. Расположим объекты в порядке возрастания значений их признаков. Тогда после отсчета в сформированном вариационном ряду первым окажется объект с наименьшим значением признака, вторым — объект со следующим по значению в возрастающем порядке признаком Новые номера объектов в таком ряду называются их рангами. Обозначим ранг радиолокационной цели, найденный после отсчета признака, через Совокупность рангов можно рассматривать как новые признаки распознавания, обладающие рядом полезных свойств.

Если сделать по отсчетов признаков каждого объекта и сопоставить этому объекту сумму рангов , то распределение статистики будет определяться путем -кратной свертки равномерного закона при условии, что наблюдаемая группа однородна, а отсчеты признаков независимы [58]:

При числе отсчетов функция хорошо аппроксимируется гауссовским законом [68] с параметрами .

В теории обнаружения сигналов гауссовская аппроксимация закона не всегда удачна, так как она может приводить к неправильной оценке допустимой вероятности ложной тревоги, задаваемой обычно на уровне При распознавании групп объектов допустимые вероятности ошибок обычно выше что делает указанную аппроксимацию вполне приемлемой даже при небольших к

Если в группе из объектов из них относятся к классу а один объект — к классу то закон распределения «мгновенного» ранга Имеет вид

где — функции распределения, определяемые законами соответственно [68].

Существует немало разновидностей ранговых алгоритмов обнаружения сигналов, которые можно использовать при распознавании групп радиолокационных целей [50, 61, 58]. Остановимся на одном из них, так называемом модифицированном правиле Вилкоксона. В соответствии с этим правилом в качестве непараметрической статистики выбирается сумма рангов , которая при распознавании каждого объекта должна сравниваться с некоторыми порогами При нимается решение о том, что радиолокационная цель по своим статистическим свойствам не отличается от большинства объектов группы. В противном случае принимается конкурирующая гипотеза. Значения порогов выбираются из условия обеспечения требуемого уровня вероятности ошибочного отнесения однородной группы к разряду смешанных.

Достоинства ранговых правил заключаются в том, что они позволяют принимать решения при небольшом числе объектов группе и обращений к ним. Другие непараметрические процедуры предполагают существенный объем выборочных данных. Кроме того, можно показать, что законы распределения ранговых статистик зависят в основном от взаимного расположения функций в пространстве признаков

Это позволяет отказаться от знания точного вида этих функций, ограничившись расчетом вероятностей того, что значение признака объекта класса , окажется большим, чем значение того же признака, характеризующего объект класса, . Соответствующие распределения ранговых статистик зачастую оказываются намного более устойчивыми, чем функции определенные на исходном множестве признаков. Так будет, например, при неизвестных аддитивных и мультипликативных погрешностях измерений признаков.

Проиллюстрируем возможности ранговых решающих процедур следующим примером. Предположим, что необходимо распознать группу из двух объектов, каждый из которых может относиться к классу либо к классу (см. табл. 6.8). Допустим вероятности групп одинаковыми. Задача выделения однородных групп сводится к поиску групп вида Найдем законы распределения ранга первого объекта наблюдаемой группы

где индексы и определяются номером группы например, для группы для группы — значения признаков, характеризующие соответственно первый и второй объекты группы;

Легко убедиться в том, что для групп однородного состава и

т. е. для таких групп ранг первого объекта равномерно распределен.

Пусть в качестве признаков используются текущие оценки ЭПР наблюдаемых объектов, которые можно считать экспоненциально распределенными:

Обозначим вероятность того, что первый объект группы получит первый ранг через а вероятность противоположного события — через и. Тогда для группы вида

Аналогично находятся и другие законы

Предположим, что Тогда распределения мгновенных рангов будут определяться вероятностями (табл. 6.9), где

Если в качестве решающей статистики использовать средний ранг первого объекта


Таблица 6.9 (см. скан)

Рис. 6.15

распределения будут зависеть от числа отсчетов признаков Функции имеют биномиальное распределение, которое с ростом хорошо аппроксимируется гауссовским законом или Соответствующие графики представлены на рис. 6.15.

Задаваясь параметрами и и числом отсчетов и значениями порогов можно оценить вероятности ошибок определения составов групп. Группы будем считать однородными, если значение среднего ранга лежит между порогами Вероятности ошибочных решений

Вычисления вероятностей ошибок в предположении, что законы гауссовские (рис. 6.16), показали что при низкой информативности признаков, когда вероятность ошибки по одному отсчету равна около 0,4, сходимость алгоритмов принятия решений низкая. При уменьшении параметра эффективность ранговых правил быстро возрастает с увеличением числа отсчетов признаков

На меньшие потери информации можно рассчитывать, если накапливать не значения рангов, а соответствующие отношения правдоподобия. Преобразуем используемую систему координат, присвоив объекту с рангом нулевой ранг Тогда

Рис. 6.16

где — число единичных рангов первого объекта, вычисленных при независимых отсчетах признака. Решающее правило распознавания групп вида имеет вид

где С — порог принятия решений.

Это неравенство можно переписать в виде

Если справедлива гипотеза решающая статистика имеет биномиальное распределение с параметрами 0,5 и При справедливости гипотезы закон биномиальный с параметрами и и; при гипотезе соответствующие параметры равны и и

Обратимся теперь к случаю, когда распределения вероятностей признаков, найденные в различных условиях наблюдения у, пересекаются незначительно, в отличие от усредненных функций (рис. 6.17,а). Им соответствуют распределения мгновенного ранга построенные при условии наблюдения групп вида (рис. 6.17,б). Такие распределения оказались намного более устойчивыми, чем функции .

Соответственно будут различаться функции при накоплении отсчетов признаков. В этом случае применение ранговых алгоритмов в неизвестных условиях наблюдения у может обеспечить существенное повышение достоверности распознавания даже при полностью известных статистических описаниях классов объектов. Экспериментальные исследования, описанные в подтвердили обоснованность такого вывода.

Таким образом, ранговый подход к распознаванию групп радиолокационных целей позволяет построить решающие процедуры, эффективные при сравнительно небольшом числе обращений к объектам При этом они могут оказаться полезными не только при недостатке априорных данных о радиолокационных целях, но и тогда, когда такая информация имеется, но признаки распознавания обладают низкой устойчивостью к вариациям условий наблюдения у.

Следует отметить, что ранговые статистики рассмотренного вида иногда могут оказаться малоэффективными, например, тогда, когда законы симметричны и отличаются только дисперсиями. В подобных ситуациях целесообразно ранжировать некоторые нелинейные функции измеренных признаков например При выполнении гипотезы ранги, рассчитанные по

Рис. 6.17 (см. скан)


значениям функций будут описываться равномерным законом.

Алгоритмы кластеризации. В теории распознавания образов существует активно развивающееся направление, называемое кластерным анализом (таксономией и др.). Основная задача кластерных алгоритмов состоит в том, чтобы разбить совокупность выборочных значений признаков на некоторое число подмножеств (кластеров). При этом в каждом из них должны оказаться близкие в некотором смысле значения признаков. В общем случае число кластеров, на которые должна быть разбита исследуемая выборка, может быть заранее известно или нет. Обычно методы кластерного анализа используются для обучения систем распознавания, а также при автоматическом разбиении генеральной совокупности объектов на классы .

При распознавании групп радиолокационных целей принципиально возможно использовать алгоритмы обучения (самообучения) распознающего автомата по совокупности отсчетов признаков объектов группы Результатом обучения могут быть уточненные описания классов или уравнения разделяющих поверхностей в пространстве признаков. Эти данные используются

затем для отнесения каждого объекта группы к одному из М классов алфавита .

Кроме оценки вероятностей алгоритмы обучения в принципе позволяют строить и приближения функций путем непосредственной оценки их моментов

Но соответствующие решающие правила могут быть реализованы только на базе параметрических моделей функций известных далеко не всегда. В отличие от алгоритмов адаптации рассматриваемые процедуры не ограничиваются оценкой числа объектов каждого класса в группе а также не предполагают знания параметрических моделей функций

Несмотря на отказ от обязательного задания законов и вероятностей кластерные методы можно с успехом применять для оценки функций или уравнений разделяющих поверхностей. При этом необходимый объем априорных сведений о распознаваемых объектах может быть близок к минимуму. Для доказательства рассмотрим следующий пример.

Предположим, что при распознавании некоторой группы из пяти объектов было выполнено по три обращения к каждому из них. Допустим также, что полученные в результате значения признаков разместились на оси так, как показано на рис. 6.18.

Анализ полученной выборки позволяет предположить, что в распознаваемой группе три объекта с номерами относятся к одному и тому же классу (виду), а объекты с номерами 2 и 3 принадлежат еще к двум классам (видам).

Привлечение дополнительной информации, например сведений о том, что число классов а среднее значение признака растет с увеличением номера класса даст основание отнести объекты и к первому классу, а объекты — к классам соответственно. Вместо этих сведений можно использовать априорную информацию о возможном соотношении числа объектов каждого класса в наблюдаемой группе.

Рис. 6.18

Достоинством рассмотренного подхода является то, что он позволяет безошибочно распознавать радиолокационные цели тогда, когда плотности не пересекаются, но условия наблюдения у учесть невозможно. Знание числа классов, представленных (в группе, намного облегчает построение эффективных решающих правил. Недостатком многих алгоритмов кластеризации служит допущение о мономодальности законов .

Процедуры кластеризации носят преимущественно эвристический характер [24, 25, 48, 34]. Для решения задачи распознавания групп радиолокационных целей может быть применено большинство из них.

Пусть, например, было принято решение о применении одного из самых простых способов кластеризации — методе гистограмм — к анализу выборки характеризующей объекты наблюдаемой группы. Разобъем для этого диапазон выборочных значений признаков на интервалов с номерами Определим относительную частоту попаданий значений признаков в каждый из них и построим соответствующую гистограмму (рис. 6.19).

Если заранее известно, что в группе представлены три класса объектов, то выбрать пороги нетрудно. Естественно будет все объекты, значения признаков которых попали слева от отнести к классу с наименьшим средним значением признака допустим к классу объекты с максимальными значениями признаков — отнести к классу а признаки, значения которых оказались между порогами, считать порожденными объектами второго класса.

Значения признаков отдельных объектов, измеренные при разных отсчетах, могут оказаться по разные стороны от порога. При этом самое простое — отнести радиолокационную цель к тому классу, которому соответствует большее число отсчетов признака Другой способ заключается в расчете статистики, основанной на сумме отклонений значений признаков от порога и классификации объекта в зависимости от ее знака.

Если число классов объектов в группе заранее не задано, то многое зависит от числа мод законов При работе с группами радиолокационных целей многомодальность функции не мешает построению алгоритмов кластеризации. Это обусловлено тем, что, во-первых, все объекты наблюдаются в одних и тех же условиях. Поэтому существенное различие их выборочных характеристик, измеренных в течение короткого промежутка времени, мало вероятно. Во-вторых, можно «проследить» за поведением признаков, измеренных от одной и той же

Рис. 6.19

Таблица 6.10 (см. скан)

Окончание табл. 6.16 (см. скан)

радиолокационной цели. Допустим, что они «дружно» колеблются от одного максимума гистограммы к другому. Естественно, что в этом случае наличие таких максимумов нельзя истолковывать как присутствие в группе объектов с различными статистическим» свойствами.

Долю субъективизма, свойственную описанному подходу, можно уменьшить, реализовав двухэтажную процедуру принятия решений. Сначала оценивается степень однородности группы, например, с помощью ранговых правил. Если гипотеза об однородности отвергается, естественно будет поставить в соответствие каждому из максимумов гистограммы свой класс объектов. Потенциальные возможности кластерных алгоритмов были проверены методом математического моделирования (подробнее см. п. 9.5.2).

Как уже отмечалось, при использовании кластерных методов в задачах распознавания групп радиолокационных целей появляется возможность присвоить отсчетам признаков номера наблюдаемых объектов. Другая особенность — это возможность учета данных о составе группы если он, конечно, определен.

Пусть, например, требуется выделить объектов первого класса из состава наблюдаемой группы размера Измерим, признаки объектов группы и разместим их в вариационном ряду в порядке роста выборочных средних некоторых функций, Вид этих функций определяется спецификой решаемой задачи.

Если выполняются неравенства вида и известны их знаки для всех , то можно найти центр кластера первого класса. К классу следует отнести объектов, наиболее близких к этому центру. Если знаки таких неравенств не заданы, то к классу следует отнести тот кластер, число объектов в котором наиболее близко к Разумеется, при задача не решается однозначно.

В табл. 6.10 приведена краткая сводка основных правил распознавания целей в группах. В ней отражены некоторые разновидности рассмотренных процедур. Основное внимание уделена крупным семействам решающих правил и наиболее характерным; для этих семейств алгоритмам.

<< Предыдущий параграф Следующий параграф >>
Оглавление