Главная > Распознавание образов > Метод потенциальных функций в теории обучения машин
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава V. ПРИМЕНЕНИЕ МЕТОДА ПОТЕНЦИАЛЬНЫХ ФУНКЦИЙ К ЗАДАЧЕ ОБ ОБУЧЕНИИ МАШИН РАСПОЗНАВАНИЮ ОБРАЗОВ (ДЕТЕРМИНИСТСКАЯ ПОСТАНОВКА ЗАДАЧИ)

В этой и последующей главах метод потенциальных функций, теоретические основы которого излагались в предыдущих главах, используется для решения двух задач об обучении машины распознаванию образов. В этой главе задача рассматривается в детерминистской постановке, а в следующей главе — в вероятностной постановке (восстановление априорных и апостериорных вероятностей).

Приступая в этой главе к рассмотрению первой из этих двух задач, напомним сначала постановку и геометрическую интерпретацию этой задачи, уже упоминавшиеся в главе I.

§ 1. Постановка задачи

Под обучением машины распознаванию образов (в детерминистской постановке) понимается следующая задача.

На «входе» машины последовательно возникают «входные ситуации», которые оператор («учитель») умеет разделять на несколько, например, на два непересекающихся класса. Детерминистский характер формулируемой ниже задачи связан именно с тем обстоятельством, что эти классы не пересекаются и что учитель однозначно и безошибочно относит объекты к некоторому классу: если один и тот же объект будет предъявлен ему несколько раз, он отнесет его всегда к одному и тому же классу. В машину не введены в какой-либо форме указания о том, по каким правилам или признакам следует распределить входные ситуации на классы. В процессе обучения при возникновении на входе машины некоторой ситуации в нее вводится информация лишь о том, какому классу эта ситуация принадлежит.

После прекращения этого процесса обучения и при возникновении на входе машины тех же или новых ситуаций она должна распознавать, к какому классу они принадлежат (экзамен).

Особенность задачи заключается в том, что в процессе обучения машине предъявляется конечное (и притом относительно небольшое) количество ситуаций, а машина после обучения должна уметь правильно классифицировать бесконечное (или весьма большое) количество ситуаций, которые могут появиться в процессе экзамена. Тем самым полностью исключается тривиальное решение задачи — простое запоминание появившихся ситуаций: конструкцией машины или ее программой должна быть предусмотрена «экстраполяция» информации, полученной в процессе обучения, на новые ситуации, которые ранее в процессе обучения не возникали на входе.

В указанной постановке задачи машина должна классифицировать ситуации на входе, хотя заранее (до начала процесса обучения) не было известно, какая именно классификация должна быть произведена. Например, при распознавании зрительных образов одна и та же машина должна обучаться отличать различные цифры, либо буквы алфавита, либо фотографии различных лиц и т. п. Какую именно классификацию требуется произвести в данном конкретном опыте, определяется лишь последовательностью ситуаций, предъявляемых в процессе обучения, и указаниями учителя. В этом смысле машина, способная обучаться распознаванию классов, должна быть «универсальной».

Чтобы связать с этой задачей геометрическую интерпретацию, о которой шла речь в главе I, введем в рассмотрение пространство входов X, построенное так, чтобы каждой входной ситуации однозначно соответствовала точка этого пространства.

По условию классы не пересекаются. Это означает, что в пространстве X существует по крайней мере одна разделяющая функция принимающая положительные значения на точках, соответствующих классу А, и отрицательные значения на точках, соответствующих классу значения в остальных точках

безразличны. В общем случае таких разделяющих функций может быть много.

В процессе обучения последовательно появляются точки в пространстве X и сообщается информация о том, какому классу — А или В — эти точки принадлежат. Задача состоит в том, чтобы, владея лишь этой информацией, за конечное число показов в процессе обучения построить функцию, аппроксимирующую какую-либо из разделяющих функций. Тогда в процессе экзамена машина сможет относить появляющиеся точки к классу А или В, в зависимости от знака в этих точках построенной разделяющей функции.

Как уже указывалось в главе I, постановка задачи об обучении машины бессмысленна, если на множество ситуаций, которые машина должна классифицировать, не наложено никаких ограничений. Действительно, в этом случае, каков бы ни был алгоритм функционирования машины и какова бы ни была разделяющая функция, выстраиваемая после предъявления конечной последовательности точек, всегда можно еще не показанные точки поименовать так, чтобы в процессе экзамена на этих точках машина всегда ошибалась. Поэтому необходимо заранее надлежащим образом ограничить выбор пространства X и класс функций с которыми приходится иметь дело. Эти ограничения применительно к рассматриваемой здесь задаче формулируются так: предполагается существование в пространстве X такой системы функций что искомую разделяющую функцию можно представить разложением

в котором коэффициенты с удовлетворяют следующему условию: существует числовая последовательность такая, что суммы и конечны. В соответствии с терминологией, введенной в § 4 главы II, это предположение является основной гипотезой метода потенциальных функций. Это условие обеспечивает достаточно быструю сходимость ряда (1).

Исходя из (1), можно ввести в рассмотрение бесконечномерное пространство с координатами Такое пространство будем называть спрямляющим. В силу (I) разделяющая функция в пространстве отображается в линейную функцию где Так как

то в пространстве точки, принадлежащие разным классам, разделяются гиперплоскостью

Алгоритмы метода потенциальных функций, решающие сформулированную выше задачу о разделении двух непересекающихся классов далее формулируются как в терминах исходного пространства X, так и в терминах спрямляющего пространства

<< Предыдущий параграф Следующий параграф >>
Оглавление