No Image

Шапиро уилка критерий в статистике интерпретация

СОДЕРЖАНИЕ
1 просмотров
11 марта 2020

Материал из MachineLearning.

Содержание

Критерий Шапиро-Уилка используется для проверки гипотезы : «случайная величина распределена нормально» и является одним наиболее эффективных критериев проверки нормальности. Критерии, проверяющие нормальность выборки, являются частным случаем критериев согласия. Если выборка нормальна, можно далее применять мощные параметрические критерии, например, критерий Фишера.

Описание критерия

Критерий Шапиро-Уилка основан на оптимальной линейной несмещённой оценке дисперсии к её обычной оценке методом максимального правдоподобия. Статистика критерия имеет вид:

Числитель является квадратом оценки среднеквадратического отклонения Ллойда.

Коэффициенты берутся из таблиц. Ниже приведена таблица для небольших значений n и i.

n i
1 2 3 4 5 6 7 8 9 10
3 7071
4 6872 1677
5 6646 2413
6 6431 2806 0875
7 6233 3031 1401
8 6052 3164 1743 0561
9 5888 3244 1976 0947
10 5739 3291 2141 1224 0399
11 5601 3315 2260 1429 0695
12 5475 3325 2347 1586 0922 0303
13 5359 3325 2412 1707 1099 0539
14 5251 3318 2460 1802 1240 0727 0240
15 5150 3306 2495 1878 1353 0880 0433
16 5056 3290 2521 1939 1447 1005 0593 0196
17 4968 3237 2540 1988 1524 1109 0725 0359
18 4886 3253 2553 2027 1587 1197 0837 0496 0173
19 4808 3232 2561 2059 1641 1271 0932 0612 0303
20 4734 3211 2565 2085 1686 1334 1013 0711 0422 0140
21 4634 3185 2578 2119 1736 1399 1092 0804 0530 0263

Критические значения статистики также находятся таблично.

Если , то нулевая гипотеза о нормальности распределения отклоняется при уровне значимости Приближённая вероятность получения эмпирического значения при вычисляется по формуле

где — табличные коэффициенты.

Критерий Шапиро-Уилка является очень мощным критерием для проверки нормальности, но, к сожалению, имеет ограниченную применимость. При больших значениях 100)" alt= "n ;(n>100)" /> таблицы коэффициентов становятся неудобными. Поэтому была предложена модификация критерия Шапиро-Уилка, о которой рассказано ниже.

Читайте также:  Как подключить смартфон к интернету мегафон

Критерий Шапиро-Франчиа

Введённая статистика имеет вид

где и — математическое ожидание i-й порядковой статистики стандартного нормального распределения. Аппроксимация где не искажает существенно критерий

Используя аппрокисмацию для квантили стандартного нормального распределения, можно записать

Решение «табличной проблемы»

Была выведена полезная аппрокисмация, позволяющая применить критерий Шапиро-Уилка без помощи таблиц. Для предлагается статистика

Если то нулевая гипотеза нормальности распределения случайных величин отклоняется. Существует модификация критерия Шапиро-Уилка для случаев группированных данных (что существенно при наличии совпадающих наблюдений).

В ряде опытов, особенно в медицинских исследованиях, численность выборки мала. Специально для проверки нормальности распределения малых, численностью от трех до пятидесяти элементов, выборок Шапиро и Уилк разработали критерий .

Итак, пусть имеется выборка . Вычисления статистики производятся по формулам:

где и . Значение в последней формуле определяется следующим образом:
, если – четное, , если – нечетное, – известные константы.

Для вычисления реально достигнутого уровня значимости применяется нормальная аппроксимация, используется следующая формула:

где – стандартное нормальное распределение, , и – константы, для которых известны, в зависимости от объема выборки, табличные значения.

Электронные таблицы

Результаты вычислений
Объем выборки Значение статистики Шапиро-Уилка Достигаемый уровень значимости

Реализация исследуемой выборки

Правила пользования таблицами

Прежде всего в текстовое поле следует поместить изучаемую выборку (это можно сделать, набрав соответствующие значения вручную либо скопировав, скажем из Excel), затем нажать кнопку "Вычислить", после чего в таблице "Результаты вычислений" появится реально достигнутый уровень значимости в критерии Шапиро-Уилка, а также объем выборки и значение статистики Шапиро-Уилка.
Отметим, что в качестве десятичного разделителя в числах можно использовать и точку, и запятую. Удалять значения из первой таблицы можно двойным щелчком мыши. Особо обратим внимание! В качестве разделителя между отдельными числами ни в коем случае не следует использовать точку и запятую, так как эти знаки используются в качестве десятичного разделителя. Отделить одно число от другого можно используя "пробел" или "ввод". Скажем, такой ввод в текстовое поле верен:

Читайте также:  Hdd western digital wd40purx

0,23 0,56 0.98
0,98 1,56 9,9 7.908

Соответственно будут обрабатываться семь значений: 0.23 0.56 0.98 1.56 9.9 7.908.

Статистику критерия рассчитывают по формуле W =b 2 /nm2. Рассчитанное значение W сравнивают с табличным Wтабл. Табличные значения критерия Wтабл в зависимости от уровня значимости α находят из таблиц, однако с приемлемой точностью их можно найти по зависимостям, показанным в табл. 9.2.

Таблица 9.2.

α Wтабл
0,01 (-0,0148n 4 + 2,1875n 3 – 122,61n 2 + 3257,3n + 55585)/100000
0,05 (-0,0113n 4 + 1,656n 3 – 91,88n 2 + 2408,6n + 67608)/100000
0,1 (-0,0084n 4 + 1,2513n 3 – 70,724n 2 + 1890n + 73840)/100000

Если W >= Wтабл, нулевую гипотезу не бракуют, т.е. распределение считают нормальным.

Пример 9.1. По данным примера 1.1 проверить при различных уровнях значимости гипотезу о нормальности распределения предела прочности на разрыв алюминиевого сплава.

Вариант выполнения примера 9.1 показан на рисунке 9.1.

Рис. 9.1. Вариант расчёта для примера 9.1.

Вводим в электронную таблицу уровень значимости и результаты испытаний, упорядочиваем их в вариационном ряду, рассчитываем среднее значение, сумму квадратов отклонений от среднего nm2, объём испытаний (какие при этом целесообразно задать в статистических функциях диапазоны?), а также величину k. Очевидно, что для любого (чётного и нечётного) n можно рассчитать k по формуле k=n/2 с округлением результата вниз до целого (функция ОКРУГЛВНИЗ).

Далее находим b. Для этого вначале рассчитываем значения n-i+1. Поскольку при этом, в соответствии с формулой (9.1), i = k, при расчёте используем функцию ЕСЛИ, в которой логическим выражением будет n-i+1>= k (т.е. ссылка на ячейку столбца G). При истинности этого выражения значение xn-i+1 находим при помощи функции ИНДЕКС, при ложности значение не задаём. Затем находим x 2 и W. Рассчитываем табличные значения критерия для различных уровней значимости по формулам табл. 7.2. Из этих значений выбираем необходимое Wтабл в соответствии с заданным уровнем значимости, используя трижды функции ЕСЛИ.

Читайте также:  Силуэт здания в черном цвете

Затем, если n < 8, с помощью функции ЕСЛИ выводим сообщение «ВЫБОРКА СЛИШКОМ МАЛА». При ложности этого логического выражения используем в строке Значение_если_ложь функцию ЕСЛИ для сравнивания W и Wтабл, и в зависимости от истинности или ложности логического выражения выводим сообщение, является ли распределение нормальным. В результате в одной ячейке (в примере – ячейка D18) должно выводиться одно из трёх сообщений, например: ВЫБОРКА СЛИШКОМ МАЛА; РАСПРЕД. НОРМАЛЬНОЕ; РАСПРЕД. НЕ НОРМАЛЬНОЕ.

При правильном выполнении электронная таблица должна вер-но пересчитываться при вводе других данных в пределах применимо-сти критерия Шапиро-Уилка.

Задание.
1. Выполнить расчёты в соответствии с примером 9.1.
2. Выборочные значения случайных величин, полученные по результатам испытаний, показаны в табл. 9.3.

Таблица 9.3.

№ выборки Р Значения в выборке
1 0,9 855 875 834 872 863 855 888 864 870 881 891 872
2 0,95 11 12 9 16 12 8 9 10 10 9 11 10 8 8
3 0,99 34 36 38 33 34 32 30 36 38 31

Предполагается, что случайные величины распределены нормально.. Используя созданные электронные таблицы, исключить грубые ошибки по критерию Ирвина, проверить нормальность распределений, в случае нормального распределения рассчитать интервальные оценки параметров этих распределений. Результаты занести в таблицу 9.4.

Таблица 9.4.

№ выборки Грубые ошибки Распределение (норм/не норм) Оценка М Оценка σ
точечная Интерв. точечная Интерв.
1 . . . . . .
2 . . . . . .
3 . . . . . .

&nbsp &nbsp &nbsp &nbsp Далее &nbsp &nbsp Содержание

Комментировать
1 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
Adblock detector