Главная > Распознавание образов > Метод потенциальных функций в теории обучения машин
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 2. Особенности исследования случайных процессов, порождаемых методом потенциальных функций

В этой главе устанавливаются достаточные условия сходимости случайных процессов. Роль этих достаточных условий в книге вспомогательная — они используются в последующих главах при доказательстве сходимости конкретных алгоритмов.

Критерии сходимости, устанавливаемые в этой книге, приспособлены к особенностям тех случайных процессов, которые порождаются методом потенциальных функций С этой целью сначала (§ 3) устанавливается ряд общих теорем о сходимости случайных процессов, которые затем (§ 4) используются для исследования сходимости процессов, порождаемых рекуррентной процедурой:

Здесь конечно или бесконечномерные векторы, случайный вектор, появляющийся на каждом шаге независимо в соответствии с некоторым заранее неизвестным условным распределением вероятностей

явно не зависящим от детерминированные функции своих переменных, а члены числовой последовательности. В случае конечномерного у и специального способа выбора процедура (4) является процедурой Роббинса — Монро метода стохастической аппроксимации (см. § 5 гл. II), а в случае специального выбора функций она является основной процедурой метода потенциальных функций (см. § 2 гл. II).

Всюду далее в этой книге на выбор последовательности накладываться условие

и, кроме того, какое-либо одно из следующих условий:

или

В § 3 условия сходимости формулируются в следующих терминах. Вводится в рассмотрение последовательность детерминированных функций

от, вообще говоря, возрастающего с ростом числа векторных конечно или бесконечномерных аргументов у, являющихся реализациями векторного случайного процесса Устанавливаются такие соотношения для функций выполняющиеся в силу свойств случайного процесса которые гарантируют стремление к нулю в том или ином смысле (по вероятности, почти наверное или в среднем) по крайней мере одной из случайных последовательностей либо

При использовании полученных условий сходимости в конкретных задачах удается подобрать функции (7) так,

что из сходимости в некотором смысле одной из этих функций к нулю следует сходимость в том же смысле случайного процесса

Теоремы § 3 различаются требованиями, которым должны удовлетворять функции Одно из этих условий — назовем его «условием — одинаково во всех теоремах § 3 и состоит в следующем.

Условие А. Математические ожидания существуют и

где числовые последовательности, такие, что

а) последовательность удовлетворяет условию (5),

либо числовая последовательность, либо последовательность функций случайных аргументов

Свойства последовательности и последовательности детализируются в каждой из теорем § 3. Как будет видно из доказательств теорем § 4, в применениях теорем § 3 к процедуре (4) оказывается, что пропорциональны у.

Условие А вместе с детализацией свойств последовательностей и составляют первое условие всех теорем § 3. Эти теоремы, различаются, по существу, своими вторыми условиями, устанавливающими дополнительные требования к связи между функциями которые вместе с первыми условиями теорем и позволяют доказывать сходимость соответствующих случайных последовательностей. Смысл вторых условий теорем § 3 — ограничить допустимый рост членов последовательности

Вторые условия теорем § 3 удается существенно ослабить, если тем или иным способом установлена

ограниченность почти всех реализаций случайного процесса

Определение. Последовательность функций называется бесконечно большой, если любая последовательность для которой предел существует и конечен, ограничена.

Для ряда теорем § 3 показывается, что почти все реализации случайного процесса действительно ограничены, если последовательность функций не только удовлетворяет первым условиям соответствующих теорем, но и является бесконечно большой. Модифицированные для случая бесконечно большой последовательности теоремы обозначаются далее тем же номером с индексом «а» (например, соответствующая модификация теоремы I фигурирует в тексте как теорема 1а).

Предлагаемый в этой главе подход к установлению сходимости случайных процессов близок по идее к прямому методу Ляпунова исследования устойчивости движения. В методе Ляпунова факт устойчивости устанавливается, если удается подобрать некоторую функцию фазовых координат, удовлетворяющую условиям, которые обеспечивают стремление ее к нулю в процессе возмущенного движения. Как видно из условия А, функции играют роль «функции Ляпунова» и «ее производной в силу процесса».

Аналоги метода Ляпунова для исследования сходимости стохастических процессов разрабатывались и ранее. Развиваемый здесь подход отличается тем, что

условия, накладываемые на «функцию Ляпунова», отражают специфику случайных процессов, порождаемых соотношениями (4) — (6). Для того, чтобы пояснить специфику таких процессов, заметим, что непрерывным детерминированным аналогом процесса (4) служат уравнения

а аналогом условий (5) и, например, (66) служат условия

Наличие в правых частях дифференциальных уравнений стремящегося к нулю (при множителя крайне затрудняет применение теоремы прямого метода Ляпунова об асимптотической устойчивости. Можно было бы предложить теоремы, также исходящие из идей прямого метода Ляпунова, но более узкие, чем теорема Ляпунова об асимптотической устойчивости, и, вместе с тем, учитывающие специфику уравнений, содержащих множитель Теоремы о сходимости случайных процессов, установленные в § 3, относятся к общим теоремам ляпуновского типа о сходимости случайных процессов так же, как упомянутые выше специфические теоремы относятся к общим теоремам прямого метода Ляпунова об асимптотической устойчивости.

<< Предыдущий параграф Следующий параграф >>
Оглавление