17.1. Т-критерий
за сравняване на средна стойност с константа
17.2. Т-критерий
за сравняване на средните на две извадки
Първо ще
разгледаме случая на една случайна величина с нормално разпределение. Нулевата хипотеза е, че математическото очакване на популацията е
. Правим извадка с обем
; нека средното на извадката е
. Дисперсията на това средно е:
(1)
Съгласно
централната гранична теорема, за достатъчно голяма извадка средното клони към случайна
величина с нормално разпределение
. Следователно, съответната нормирана случайната величина ще
има стандартно нормално разпределение:
(2)
С това
задачата би се свела до познатата задача за проверка на хипотезата за
принадлежност към стандартно нормално разпределение, ако би била известна.
Проблемът е, че обикновено
не е известна; вместо
нея ние разполагаме само с една нейна оценка чрез извадката:
(3)
Съответната
оценка за ще бъде:
(4)
Сега, ние се
интересуваме от разпределението на случайната величина:
(5)
Очевидно,
това разпределение ще се отличава от разпределението на (което е
) поради замяната
.
Без
ограничение на общността можем временно да считаме, че (това води до проста транслация по абсцисната ос на търсеното
разпределение). Тъй като
(
е броят на степените на свобода), то ясно е, че величината
представлява частно на
две случайни величини: тази в числителя има нормално разпределение, а тази в
знаменателя е квадратен корен от величина с разпределение
. Вероятностната плътност на (5) при условие, че
е:
(6)
Това
разпределение се нарича разпределение
на Стюдънт (Student). То е симетрично (четна функция на ) и зависи от един параметър – броя на степените на свобода
. При
то клони към нормално. На фигурата е показано разпределението
на Стюдънт
в сравнение с нормалното разпределение
.
Т-критерият
(известен още като критерий на Стюдънт) за средната стойност на една случайна величина
се прилага така:
·
Приемаме за вярна нулевата хипотеза, че
математическото очакване на популацията е ;
·
Избираме ниво на значимост ;
·
намираме границите на критичната област
(разпределението е
симетрично и тук имаме двустранен критерий, така че те са две симетрични числа)
от условието:
;
·
правим измерванията, получаваме
извадката и пресмятаме статистиката: ;
·
ако , то хипотезата
се отхвърля за нивото
на значимост
.
Този
критерий може да се обобщи и да се използува за сравняването на средните
стойности на две извадки.
Нека от две
популации и
са направени две
извадки с обеми
и
. Хипотезата, която ще проверяваме, е, че
.
Средните по
извадка имат приблизително нормално разпределение (съгласно централната
гранична теорема). Техните дисперсии са:
(1)
Оценките за
дисперсиите от извадката са:
(2)
Знаем, че
разликата:
(3)
е също
приблизително нормално разпределена и оценката за нейната дисперсия е:
(4)
Ако нашата
хипотеза е вярна (), то, очевидно,
и ще е в сила:
(5)
Тогава
веднага може да пресметнем вероятността нулевата хипотеза да е вярна, ако е известно. Ние обаче разполагаме само с оценката (4).
Обикновено
се предполага, че и
са от една и съща генерална
съвкупност (това във всеки случай е в съгласие с предположението ни за
верността на нулевата хипотеза). Тогава:
(6)
Следователно:
(7)
което е
претегленото средно на и
, е най-добрата оценка за дисперсията на популацията ((7)
всъщност е равноправно сумиране на всички индивидуални дисперсии).
В такъв
случай:
, (8)
Доказва се,
че величината:
(9)
се подчинява
на разпределението на Student с степени на свобода.
Този
критерий се прилага по-нататък напълно аналогично на критерия на Стюдънт от
предния раздел.