Главная > Распознавание образов > Методы распознавания
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 7.3. Построение алгоритма управления процессом распознавания

Уравнение (7.10) определяет множество всех возможных последовательных правил поиска решений. В этом множестве должно быть определено правило, оптимальное с точки зрения минимизации затрат на проведение процесса распознавания. Для отыскания этого правила введем в рассмотрение карту штрафов согласованную с системой ограничений Г. Величина означает штраф, уплачиваемый в случае, когда подвергается распознаванию объект Для определения признаков объекта проведены эксперименты с исходами и принято окончательное решение Как правило, имеет место такая ситуация, когда расходы на проведение экспериментов при помощи технических средств суммируются и не зависят от объектов и конкретных исходов экспериментов . В этом случае

где ущерб от принятия окончательного решения о том, что после проведения стадий экспериментов.

Для каждого объекта и выбранного последовательного правила величина среднего убытка равна математическому ожиданию от величины

где математическое ожидание подсчитывается в соответствии с распределением которое определяет вероятность исхода опыта при условии, что проведенные эксперименты дали исходы по всем возможным цепочкам развития эксперимента — до принятия окончательного решения в алгоритме Величина среднего убытка, вычисляемая по всем возможным цепочкам исходов алгоритма оканчивающимся принятием окончательного решения может быть определена иначе так:

где вероятность реализации цепочки экспериментов, закончившихся исходами она может быть выражена следующим образом:

число всех возможных цепочек развития экспериментов. Поскольку алгоритм (7.10) должен носить массовый характер и заранее не известно, какого класса объект будет подвергаться распознаванию в каждой из конкретных ситуаций, то величину убытка следует усреднять при помощи априорной вероятности появления объектов соответствующих классов и каждый алгоритм характеризовать величиной

где — функция убытка, функция риска.

Теперь появилась возможность, подобно тому, как это осуществляется в теории последовательных статистических решений, методологические вопросы выбора приемлемого правила поиска последовательных решений рассматривать как игру двух сторон с функцией убытка . В качестве одной стороны выступает «вероятный противник», чистые стратегии которого — все объекты из в качестве второй стороны — «система распознавания», чистые стратегии которой — совокупность последовательных правил из Это, в свою очередь, позволяет рассматривать вопросы существования чистых минимаксных стратегий, смешанных минимаксных стратегий и байесовых стратегий. Класс байесовых стратегий оказывается в некотором смысле полным, т. е. для любой небайесовой

стратегии найдется лучшая (или, во всяком случае, не худшая) байесовая стратегия. Исходя из этого, в дальнейшем будем придерживаться именно байесового подхода к решению задачи.

Оптимальным байесовым последовательным правилом назовем такой алгоритм который минимизирует Это означает, что

для всех возможных алгоритмов При реализации системы распознавания целесообразно использовать оптимальные байесовы алгоритмы. Принципиальная возможность построения таких алгоритмов, рассчитанных заранее до начала функционирования системы распознавания, определяется рекуррентными уравнениями для функций риска. Введем в рассмотрение следующие определения.

Риском прекращения экспериментов после цепочки исходов назовем величину

где - величина апостериорной вероятности, вычисляемая с помощью формулы Байеса по априорной вероятности появления объектов данного класса и априорным вероятностям вида

Частный случай риска прекращения эксперимента после цепочки исходов -риск принятия окончательного решения без проведения экспериментов который равен

Величина риска прекращения экспериментов после проведения опытов с исходами определяется расходами на проведение этих опытов и наименьшими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта соответствующему классу на основе полученной информации

Риском продолжения экспериментов после цепочки исходов назовем величину

где берется по всем возможным последовательным правилам которые в соответствии с системой ограничений Г можно последовательно построить с помощью экспериментов, принадлежащих соответственно стадиям.

Величина риска продолжения экспериментов после проведения опытов ось с исходами определяется расходами на дальнейшее проведение экспериментов стадии, спланированных на основе оптимального последовательного правила

В соответствии с (7.12) эти расходы определяются как затратами на проведение собственно экспериментов стадии, так и наименьшими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта к соответствующему классу на основе полученной информации

Риском после цепочки исходов называется

Приведенные определения позволяют записать следующее рекуррентное уравнение:

где

представляет собой вероятность исхода эксперимента

При планировании процесса распознавания количество стадий экспериментирования можно ограничить некоторым числом Тогда для любой цепочки экспериментов будет иметь место равенство

Рекуррентное уравнение (7.21) с учетом (7.23) позволяет на основе использования рекурсии от и т. д. и данных о значениях после каждой стадии проведения экспериментов от первой до восстановить значения функций риска при всех значениях

Порядок расчета таков. После установления количества стадий экспериментов определяются значения По величине в соответствии с (7.21) находится величина сопоставления величин в соответствии с (7.20) определяется значение Это в свою очередь на основе (7.21) позволяет найти -кратное повторение описанной процедуры расчетов

дает возможность определить значения вплоть до риска проведения экспериментов первой стадии

Нахождение значений функций риска продолжения и прекращения экспериментов после каждой стадии позволяет осуществлять оптимальное последовательное планирование проведения экспериментов: эксперименты последовательно проводятся до тех пор, пока Как только (после исходов величина риска продолжения эксперимента становится больше или равна величине риска прекращения экспериментов эксперименты следует прекратить и принять решение при котором достигается

Порядок управления экспериментами (до тех пор, пока их выгодно продолжать) определяется с помощью функции риска продолжения экспериментов в качестве в байесовом правиле следует выбирать такой эксперимент на котором достигается в правой части рекуррентного уравнения для риска (7.21).

Таким образом, реализация оптимального управления процессом распознавания связана с выполнением следующих расчетных работ:

1. На основе карты штрафов, априорных вероятностей появления объектов соответствующих классов и условных законов распределения значений признаков по классам в соответствии с (7.17) определяются значения рисков прекращения экспериментов после каждой стадии

2. Из физических соображений определяется предельное количество стадий экспериментирования (величина

3. На основе (7.21) рассчитываются значения рисков продолжения экспериментов для всех стадий от до первой.

4. Из сравнения величин для всех возможных исходов экспериментов определяется оптимальное количество стадий экспериментальных работ.

<< Предыдущий параграф Следующий параграф >>
Оглавление