Главная > Разное > Основные принципы планирования эксперимента
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.2. Приемы дисперсионного анализа

Чтобы рассмотреть основания для применения F-критерия в однофакторном дисперсионном анализе, можно взять совокупностей, каждая из которых соответствует одному варианту исследования. Данные наблюдений представлены в табл. 3.3. Здесь использование точки

Таблица 3.3. Представление результатов наблюдений для однофакторного дисперсионного анализа

вместо индекса указывает на суммирование по всем наблюдениям в данной совокупности. Так как каждый элемент совокупности можно измерить и вернуть в совокупность, то из каждой совокупности можно взять бесконечное число наблюдений, поэтому и т. д., обозначает среднее по всем совокупностям, т. е. В этой модели эффект испытания также

можно представить как и тогда математическая модель будет иметь вид

или

Очевидно, что последнее выражение представляет собой тождество, справедливое для всех Его можно записать по-другому:

Поскольку эти средние значения неизвестны, то из каждой совокупности берутся случайные выборки и можно получить оценки для общего среднего и средних каждой совокупности. Если для каждого испытания берутся наблюдений и не обязательно, чтобы эти числа были одинаковы, то представление выборочных данных может быть таким, как показано в табл. 3.4.

Таблица 3.4. (см. скан) Представление выборок для однофакторного дисперсионного анализа

Здесь сумма наблюдений, взятых в испытании; число наблюдений в испытании; наблюденное среднее для испытания; — общая сумма всех наблюдений

— среднее по всем наблюдениям.

Заметим также, что

Подставив эти выборочные статистики вместо соответствующих параметров совокупности в тождество (3.1), получим тождество вида

Это выражение показывает, что отклонение любого элемента выборки от общего среднего можно представить в виде суммы отклонения этого элемента от среднего по испытанию и отклонения последнего от общего среднего.

Если обе части тождества (3.2) возвести в квадрат и просуммировать по то получим

Исследуя последнее выражение в правой части тождества, находим

Легко видеть, что член в квадратных скобках равен нулю, поскольку сумма отклонений относительно

среднего в пределах данного испытания равна нулю. Следовательно,

Это соотношение можно рассматривать как «основное уравнение дисперсионного анализа», выражающее то положение, что сумма квадратов отклонений от общего среднего равна сумме квадратов отклонений средних по испытанию от общего среднего плюс сумма квадратов отклонений внутри испытаний. В гл. 2 была получена несмещенная оценка дисперсии совокупности в виде суммы квадратов отклонений деленной на соответствующее число степеней свободы Если гипотеза, проверяемая с помощью дисперсионного анализа, верна, т. е. если для всех или не существует эффектов вариантов испытаний, то и в математическую модель входит лишь среднее совокупности и случайная ошибка В этом случае любой из трех членов уравнения (3.4) можно использовать для получения несмещенной оценки дисперсии. Например, разделив левую часть уравнения на соответствующее число степеней свободы получим несмещенную оценку для дисперсии совокупности Если рассматривать лишь испытание, то, разделив — на число степеней свободы , найдем несмещенную оценку дисперсии для испытания. Если дисперсии для всех испытаний фактически одинаковы, то, объединив их оценки, получим

т. е. оценку для дисперсии совокупности с степенями свободы. Еще одну оценку можно

получить из равенства предварительно оценив дисперсию средних Несмещенной оценкой будет и, следовательно, несмещенной оценкой является

Эту величину получим, просуммировав первый член правой части уравнения (3.4) по и разделив на число степеней свободы . Таким образом, если гипотеза верна, то при однофакторном дисперсионном анализе возможны три различные несмещенные оценки дисперсии В силу равенства (3.4) эти три оценки не будут независимыми. Однако можно показать, что если гипотеза верна, то две независимые оценки можно получить, разделив каждую сумму квадратов правой части выражения (3.4) на соответствующее число степеней свободы; обе оценки будут иметь распределение Сравнив две такие независимые несмещенные оценки одной и той же дисперсии, можно показать, что их отношение имеет -распределение с и N - k степенями свободы. Поэтому если гипотеза верна, то для проверки гипотезы можно использовать критическую область -распределения с степенями свободы. При этом

За критическую область распределения обычно принимается верхний шлейф кривой F-распределения. Если то гипотеза отвергается (а — вероятность того, что величина, подчиняющаяся F-распределению, примет значение, большее Сумма квадратов отклонений средних по испытаниям от общего среднего всегда стоит в числителе отношения и, следовательно,

значимость этого отношения показывает, что разности между средними несут в себе нечто большее, чем оценку дисперсии. Это, возможно, указывает на то, что есть существенная разница между средними по испытаниям и что гипотезу Но нужно отвергнуть. Эти несмещенные оценки дисперсии (суммы квадратов отклонений, деленные на соответствующее число степеней свободы) будем также называть средними квадратами.

Таблица 3.5 (см. скан) Формулы для проведения однофакторного дисперсионного анализа

На практике суммы квадратов, указанные в (3.5), вычислять значительно легче, если сначала раскрыть скобки и затем записать выражения, зависящие только от сумм по испытаниям. Формулы для вычислений даны в табл. 3.5. Для применения вышеприведенных формул к данным табл. 3.1 эти величины можно предварительно закодировать, вычитая 50 из каждого показания (при этом значение F-статистики не меняется). В табл. 3.6

Таблица 3.6. Закодированные данные для исследования удельной проводимости телевизионных трубок

представлены закодированные данные и необходимые статистики, вычисленные по этим данным. По формулам, приведенным в этой таблице, легко вычислить суммы квадратов. Общая сумма квадратов представляет собой сумму квадратов всех наблюдений за вычетом поправочного члена. Поправочный член — возведенная в квадрат общая сумма всех наблюдений, деленная на общее число наблюдений

Сумма квадратов отклонений средних по испытаниям от общего среднего получается, если просуммировать наблюдений для каждого испытания, возвести эту сумму в квадрат, разделить на число наблюдений, сложить эти величины по всем испытаниям и затем вычесть поправочный член

Сумма квадратов для ошибки определяется разностью

Эти результаты представлены в табл. 3.2; для проверки гипотезы как показано выше, применен -критерий. «Математическое ожидание средних квадратов» будет более подробно рассмотрено в дальнейшем (см. гл. 10). В этом столбце записываются усредненные значения средних квадратов для использованной модели. При этом не делается никаких предположений относительно того, верна или нет гипотеза В этой задаче величина 12,7 — несмещенная оценка а 378,3 — несмещенная оценка где -дисперсия между испытаниями. Теперь рассмотрим случай, когда гипотеза верна, при этом эффекты во всех испытаниях одинаковы и равна нулю. Следовательно, обе величины будут оценками Очевидно, наблюдаемая разность между средними значительно превосходит величину, которую можно принять за случайное отклонение оценки Следовательно, -величина, отличная от нуля.

В этом вопросе несущественно, представляет ли дисперсию бесконечного числа средних по испытаниям (наблюденные значения будут случайной выборкой) или

дисперсию для фиксированных средних. В последнем случае

этот вопрос более подробно обсуждается в гл. 10.

<< Предыдущий параграф Следующий параграф >>
Оглавление