17. Т-критерий за сравняване на средни

17.1. Т-критерий за сравняване на средна стойност с константа

17.2. Т-критерий за сравняване на средните на две извадки

17.1. Т-критерий за сравняване на средна стойност с константа

Първо ще разгледаме случая на една случайна величина с нормално разпределение. Нулевата хипотеза е, че математическото очакване на популацията е . Правим извадка с обем ; нека средното на извадката е . Дисперсията на това средно е:

(1)

Съгласно централната гранична теорема, за достатъчно голяма извадка средното клони към случайна величина с нормално разпределение . Следователно, съответната нормирана случайната величина ще има стандартно нормално разпределение:

(2)

С това задачата би се свела до познатата задача за проверка на хипотезата за принадлежност към стандартно нормално разпределение, ако би била известна. Проблемът е, че обикновено не е известна; вместо нея ние разполагаме само с една нейна оценка чрез извадката:

(3)

Съответната оценка за ще бъде:

(4)

Сега, ние се интересуваме от разпределението на случайната величина:

(5)

Очевидно, това разпределение ще се отличава от разпределението на (което е ) поради замяната .

Без ограничение на общността можем временно да считаме, че (това води до проста транслация по абсцисната ос на търсеното разпределение). Тъй като ( е броят на степените на свобода), то ясно е, че величината представлява частно на две случайни величини: тази в числителя има нормално разпределение, а тази в знаменателя е квадратен корен от величина с разпределение . Вероятностната плътност на (5) при условие, че е:

(6)

Това разпределение се нарича разпределение на Стюдънт (Student). То е симетрично (четна функция на ) и зависи от един параметър – броя на степените на свобода . При то клони към нормално. На фигурата е показано разпределението на Стюдънт в сравнение с нормалното разпределение .

Т-критерият (известен още като критерий на Стюдънт) за средната стойност на една случайна величина се прилага така:

· Приемаме за вярна нулевата хипотеза, че математическото очакване на популацията е ;

· Избираме ниво на значимост ;

· намираме границите на критичната област (разпределението е симетрично и тук имаме двустранен критерий, така че те са две симетрични числа) от условието: ;

· правим измерванията, получаваме извадката и пресмятаме статистиката: ;

· ако , то хипотезата се отхвърля за нивото на значимост .

Този критерий може да се обобщи и да се използува за сравняването на средните стойности на две извадки.

17.2. Т-критерий за сравняване на средните на две извадки

Нека от две популации и са направени две извадки с обеми и . Хипотезата, която ще проверяваме, е, че .

Средните по извадка имат приблизително нормално разпределение (съгласно централната гранична теорема). Техните дисперсии са:

(1)

Оценките за дисперсиите от извадката са:

(2)

Знаем, че разликата:

(3)

е също приблизително нормално разпределена и оценката за нейната дисперсия е:

(4)

Ако нашата хипотеза е вярна (), то, очевидно, и ще е в сила:

(5)

Тогава веднага може да пресметнем вероятността нулевата хипотеза да е вярна, ако е известно. Ние обаче разполагаме само с оценката (4).

Обикновено се предполага, че и са от една и съща генерална съвкупност (това във всеки случай е в съгласие с предположението ни за верността на нулевата хипотеза). Тогава:

(6)

Следователно:

(7)

което е претегленото средно на и , е най-добрата оценка за дисперсията на популацията ((7) всъщност е равноправно сумиране на всички индивидуални дисперсии).

В такъв случай:

, (8)

Доказва се, че величината:

(9)

се подчинява на разпределението на Student с степени на свобода.

Този критерий се прилага по-нататък напълно аналогично на критерия на Стюдънт от предния раздел.