Главная > Математика > Восстановление зависимостей по эмпирическим данным
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 4. Два механизма минимизации среднего риска

В этом параграфе мы будем полагать, что нам известна абсолютная оценка величины возможных потерь

Наша цель состоит в том, чтобы по случайной независимой выборке

сконструировать такой эмпирический функционал

точка минимума которого с заданной вероятностью доставляет функционалу среднего риска

значение, близкое к минимальному.

Существует «естественный» способ построения такого эмпирического функционала. Надо восстановить по выборке (2.19) плотность распределения вероятностей а затем подставить в (2.20) восстановленную плотность вместо

Полученный таким образом функционал не зависит от неизвестной плотности и принципиально может быть минимизирован.

Казалось бы, проблема минимизации среднего риска по эмпирическим данным сводится к восстановлению плотности распределения вероятностей. Задача же восстановления по случайной независимой выборке плотности распределения вероятностей является центральной в матемц

тической статистике, и, таким образом, решение одной из частных проблем статистики — минимизация среднего риска по эмпирическим данным — ставится в зависимость от решения ее центральной проблемы.

В следующем параграфе мы подробно рассмотрим постановку задачи о восстановлении плотности распределения вероятностей, цель же этого параграфа — установить, что существуют два различных механизма, позволяющих решать задачу минимизации среднего риска по эмпирическим данным. Один из этих механизмов действительно опирается на то, что восстанавливаемая плотность приближается к истинной, в то время как другой механизм имеет совершенно иную теоретическую основу.

Итак, пусть Рассмотрим два типа эмпирических функционалов: эмпирический функционал типа

где эмпирическая плотность, восстановленная по выборке и эмпирический функционал

Эмпирический функционал (2.22) принято называть функционалом эмпирического риска.

Формально функционал эмпирического риска является частным видом эмпирического функционала (2.21). В самом деле, если в качестве аппроксимирующей плотности в (2.21) использовать плотность

где

размерность вектора ), то при окажется, что Здесь использован факт

Однако имеет смысл выделять функционал (2.22), так как успех в минимизации среднего риска путем

минимизации функционалов (2.21) и (2.22) может определяться разными причинами. В первом случае успех может быть обеспечен за счет близости восстановленной плотности к истинной, тогда как во втором случае плотность при малых не приближается к и тем не менее возможны условия, когда точка минимума функционала эмпирического риска доставляет функционалу (2.20) значение, близкое к минимальному.

Действительно, пусть плотность близка к т. е.

и пусть минимум эмпирического функционала достигается при а минимум среднего риска при Тогда справедлива цепочка неравенств

откуда следует близость минимумов функционалов (2.20) и (2.21).

Покажем теперь, что аппроксимирующая плотность (2.23) при не приближается к истинной. Пусть ограниченная функция. Разобьем множество на два подмножества: множество малой меры, содержащее все элементы выборки, и множество

Нетрудно проверить, что для достаточно малого 8 может быть выбрано такое множество что

Таким образом, успех минимизации среднего риска (2.20) методом минимизации функционала эмпирического риска (2.22) определяется не близостью плотностей, как в первом случае, а иным механизмом. Ниже в § 6 мы покажем, что этот механизм опирается на свойство равномерной сходимости эмпирических средних к математическим ожиданиям по некоторому множеству событий.

<< Предыдущий параграф Следующий параграф >>
Оглавление