Главная > Распознавание образов > Метод потенциальных функций в теории обучения машин
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 4. Экстремизируемый функционал

Приступим теперь к определению функционала, который минимизируется процедурой, описанной в § 2, и по отношению к которой процедура (13) является градиентной (в статистическом смысле).

В § 4 главы II было показано, что такой функционал существует всегда, когда в алгоритме метода потенциальных функций все и что этот функционал даётся выражением (37) главы II

где функция определяется выражением (33) главы II.

Для того, чтобы получить явное выражение функционала для алгоритма, рассматриваемого в этой главе, воспользуемся выражением (6). Из выражения (33) главы II получаем

Таким образом, при построении разделяющей поверхности процедура этой главы является статистически градиентной по отношению к функционалу

Обратим теперь внимание на то, что подынтегральная функция в (15) неотрицательна, каковы бы ни были функции Действительно, рассмотрим значение функции

в следующих трех случаях:

а) х таково, что либо тогда ;

б) х таково, что либо тогда ;

в) ; тогда независимо от того, как доопределена функция в нуле.

Что же касается функции то она не может быть равна нулю при так как разделяет множества Далее обратим внимание на то, что функция обращается в нуль тождественно не только тогда, когда является одной из разделяющих функций, так как в этом последнем случае знаки совпадают при всех , но и, например, тогда, когда

Таким образом, в данном случае экстремизация функционала (15) может привести к одной из разделяющих функций, а может привести и к «ложному» решению задачи — к функции которая не является разделяющей, так как такая функция не имеет разных знаков на точках, принадлежащих множествам

Возможность «ложного» решения, о котором идет речь, приводит к важным следствиям, касающимся «грубости» рассматриваемой процедуры по отношению к учитываемому числу гармоник Этот вопрос особо важен при использовании схемной (персептронной) реализации, когда число гармоник по которой ведется разложение, конечно и заранее фиксировано. В связи с тем, что в подобных случаях выстраиваемая функция имеет вид

перепишем функционал (15) так:

Если функция может быть представлена разложением по системе содержащей не более гармоник, то, как это будет показано в следующем параграфе, процедура сходится к одной из разделяющих функций Поэтому в этом случае функционал стремится к своему минимуму, равному нулю, за счет стремления к нулю выражения в квадратных скобках; при этом сами функции не стремятся к тождественному нулю. Тем самым будет показано, что «ложные» решения в этом случае не возникают.

Представим себе теперь, что мы ошиблись в оценке числа гармоник, требуемых для восстановления хоть какой-либо разделяющей функции. Тогда заведомо при любой функции будут существовать такие , что знаки различны, выражение в квадратных скобках будет отлично от тождественного нуля, а обращение функционала (17) в нуль возможно лишь за счет «ложных» решений.

На первый взгляд могло бы показаться, что если вместо принять в качестве у" убывающую последовательность, то можно избежать получения «ложного» решения в случае, когда число гармоник выбрано неверно. В этом случае были бы выполнены все условия теоремы XIV из главы IV и, следовательно, было бы обеспечено стремление функционала к нулю. Однако это стремление к нулю могло бы иметь место только лишь за счет «ложного» решения. Если же используется выражение (5) для не включающее «сжимающего множителя», процедура при ошибочном выборе числа вообще не сходится к решению, даже «ложному», а приводит к нерегулярному «качанию» около нуля определяемых алгоритмом коэффициентов В связи с тем, что эти качания происходят около нулевых значений коэффициентов, разделяющая плоскость в спрямляющем пространстве, выстраиваемая в силу процедуры, нерегулярно и произвольно «качается». Процедура не приводит в этом случае даже к приближенному разделению областей Без проведенного анализа можно было бы думать, что при ошибочном выборе числа с ростом хотя и не достигается полное разделение областей но достигается в каком-либо смысле приближенное разделение. Мы видим, однако, что это не так, и поэтому процедура (13), (5) не груба по отношению к выбору числа

<< Предыдущий параграф Следующий параграф >>
Оглавление