Главная > Распознавание образов > Методы распознавания
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 4.8. Выбор признакового пространства при отсутствии априорного словаря

Выше были рассмотрены методы определения признакового пространства в условиях ограничений на стоимость его реализации и методы сравнительной оценки признаков. Возможность применения этих методов связана с наличием априорного словаря признаков. Однако в практике построения систем распознавания приходится сталкиваться с ситуациями, когда априорный словарь признаков неизвестен, а дана лишь некоторая совокупность реализаций сигналов, характеризующих явления или процессы, для распознавания которых предназначена разрабатываемая система. К таким сигналам могут быть отнесены, например, звуковые, возникающие в процессе работы некоторых технических устройств; радиолокационные или световые, отраженные от каких-либо объектов; электрические, возникающие при электрокардиографических или энцефалографических исследованиях, и т. д.

В подобных ситуациях возникает следующая задача: на основе совокупности сигналов, характеризующих каждый класс объектов или явлений, определить и упорядочить признаки, приписывая больший вес признаку, несущему больше информации при различении объектов или явлений. Решение этой задачи на основе разложения Карунена — Лоэва состоит в следующем [7].

Пусть множество объектов или явлений подразделено на классы получена совокупность реализаций сигналов на интервале характеризующая объекты, известна априорная вероятность появления объектов сигналы представляют собой случайные функции. Положим, что функции обладают разложением

для всех где случайные коэффициенты, математическое ожидание которых множество детерминированных ортонормированных координатных функций на интервале

Корреляционная функция случайных процессов, описывающих классы

Подставив (4.98) в (4.99), получим

Пусть случайные коэффициенты удовлетворяют условиям

Тогда (4.99) приобретает вид

или

Если можно поменять местами суммирование и интегрирование, то

Разложение (4.98), в котором определяются согласно (4.103) или (4.104) через корреляционную функцию называется обобщенным разложением Карунена — Лоэва.

Искомое признаковое пространство (координатная система) образуется в результате решения интегрального уравнения Фредгольма второго рода (4.104), ядро которого — корреляционная функция случайных процессов описывающих классы на интервале наблюдения относительно координатных функций

При упорядочении координатных функций в порядке убывания соответствующих им собственных значений коэффициенты разложения случайных процессов обладают также в порядке убывания наилучшими разделительными качествами, т. е. вносят в систему большее количество информации. Это означает следующее. Пусть координатным функциям соответствуют значения дисперсий и при этом Тогда признак обладает лучшими разделительными свойствами, чем признак Использование признака вносит в систему распознавания больше информации, чем использование признака Заметим, что представляют собой дисперсию математического ожидания распределений найденных признаков при переходе от класса к классу (см. § 4.6).

Построение признакового пространства системы распознавания на основе коэффициентов разложения Карунена — Лоэва обеспечивает минимизацию начальной энтропии системы, определяемой величиной При этом среднеквадратичная ошибка, возникающая за счет того, что реальное признаковое пространство системы реализуется на основе конечного числа признаков, минимальна.

Рис. 4.5

Рис. 4.6

Рис. 4.7

Пример Пусть дана совокупность реализаций сигналов, принадлежащих классам Будем полагать, что сигналы описывают эргодические случайные стационарные процессы. Выполнено усреднение по множеству реализаций, относящихся к каждому классу, и построены корреляционные функции и

Последние будем рассматривать в качестве описаний классов (рис. 4.5).

Корреляционные функции представим в виде набора числовых значений, относящихся к дискретным моментам времени, а затем применительно к выполним обобщенное разложение Карунеиа—Лоэва. В результате найдем, что суммарное значение дисперсии при этом два члена разложения (20-й и обеспечивают значение дисперсии что составляет 97,7% от суммарной дисперсии. Это дает основание признаковое пространство проектируемой системы распознавания строить с использованием только двух признаков, которые обозначим При этом оценки математических ожиданий и дисперсий признаков по классам соответственно равны:

На рис. 4.6 и 4 7 показаны гистограммы, представляющие собой описания классов и а языке признаков

Из рисунков видно, что признак обладает лучшими разделительными свойствами, чем признак (действительно, в то время как

<< Предыдущий параграф Следующий параграф >>
Оглавление