Обща теория

14. Обща теория

При статистическия анализ на експериментални данни ние се стремим да оценяваме стойностите на параметри, които имат определен физически смисъл. Тези параметри не могат да се считат за съвършено неизвестни. Напротив, много често ние имаме конкретни очаквания за стойностите на тези параметри – въз основа на предварителни ориентировъчни експерименти, някакви модели или пък от теорията. Така че целта на измерванията, които провеждаме, е всъщност проверката на дадена хипотеза.

Статистическа хипотеза се нарича всяко твърдение относно статистическите свойства на изучаваните случайни величини.

В много случаи хипотезата, подлежаща на проверка, се състои от предположение за вероятностната плътност на разглежданата случайна величина. Една хипотеза се нарича проста, ако тя напълно характеризира вероятностната плътност, т.е. тя предполага напълно определени стойности за всички параметри, от които зависи разпределението на всички случайни величини в дадения експеримент. Хипотезата е сложна, ако общият функционален вид на вероятностното разпределение е известен, но точната стойност поне на един от неговите параметри не е определена.

Примери:

·        проста хипотеза:  има стандартно нормално разпределение (тук всички параметри са определени – математическото очакване е 0,  а дисперсията – 1);

·        сложна хипотеза:  има нормално разпределение със средна стойност напр. 5.6 (тук дисперсията остава неуточнена).

 

Хипотезата, която се проверява в даден момент, се нарича нулева. Всяка друга хипотеза относно същия експеримент се нарича алтернативна.

Как се проверяват статистическите хипотези? При осъществяване на измерванията ние можем да получим оценки чрез извадката за един или друг параметър на вероятностното разпределение на популацията, който представлява интерес за нас. Тъй като всяка проста нулева хипотеза дава пълното вероятностно разпределение в пространството на извадките, то от нея може да се пресметне априорната вероятност за получаване на именно тази стойност на оценката, която сме определили въз основа на извадката. Така на всеки резултат от измерването ние можем да съпоставим едно число – вероятността той да се осъществи, ако нулевата хипотеза е вярна. Ясно е, че ако тази вероятност е голяма, то и вероятността хипотезата ни да е правилна е също голяма, и обратно. Проблемът обаче се състои в това, че поради статистическия характер на измерванията са възможни по принцип  всякакви резултати (с определени вероятности). Така че ние не можем да дадем прост отговор на простия въпрос: вярна ли е в крайна сметка проверяваната хипотеза или не?

Тъй като все пак е необходимо да вземем решение (което може да има много важни последици за по-нататъшните ни действия), ние постъпваме по следния начин:

·        предполагаме, че нулевата хипотеза  е вярна;

·        предварително (преди експеримента) определяме едно (обикновено малко) число , което се нарича ниво на значимост;

·        построяваме една критична област  от условието: . Това е вероятността резултатът да попадне в критичната област  при условие, че  е вярна (забележете, че критичната област  не се определя еднозначно от числото );

·        извършваме експеримента и проверяваме дали резултатът от измерването  попада в критичната област;

·        Ако , ние отхвърляме хипотезата H0 за нивото на значимост a;

·        в противния случай ние не можем да изкажем противоположното твърдение, т.е. не можем да приемем, че хипотезата  е вярна. Ние можем да кажем само, че  е съвместима с резултатите от нашия експеримент (при ниво на значимост a).

Нивото на значимост a е мярка за риска нулевата хипотеза  да е вярна, макар че сме я отхвърлили. Такава грешка се нарича грешка от първи род. Подобна грешка е неизбежна поради вероятностния характер на измерването (иначе трябва да положим ; тогава цялото пространство на извадките ще бъде извън критичната област и никакво решение относно валидността на нулевата хипотеза не може да бъде взето). Все пак ние имаме свободата да избираме нивото на значимост a. Този избор се прави в зависимост от евентуалните последици от възможната грешка от първи род в конкретния случай - колкото те са по-значителни, толкова по-малко трябва да бъде a. В практиката на научните изследвания обикновено се използуват стойностите a = 0.05, 0.01, 0.001 и съществуващите таблици на статистическите разпределения са съобразени с тези стойности.

 

Има още една възможност да приемем грешно решение, именно да отхвърлим някоя вярна алтернативна хипотеза поради това, че  не попада в критичната област. Такава грешка се нарича грешка от втори род. Вероятността за грешка от втори род зависи от конкретната алтернативна хипотеза, която е погрешно отхвърлена.

Близо до ума е, че един критерий за проверка на хипотези ще бъде особено полезен, ако при зададена вероятност a за грешка от първи род критичната област бъде определена така, че грешката от втори род да е минимална. Критерии, които отговарят на условието за минимизиране на вероятността за отхвърляне на дадена вярна проста алтернативна хипотеза при зададено ниво на значимост a се наричат най-мощни критерии. Може да съществуват и равномерно най-мощни критерии; това са такива критерии, които са най-мощни спрямо всяка възможна алтернативна хипотеза.

Директната проверка за принадлежност на резултата от експеримента към критичната област е неудобна в многомерния случай, тъй като тя може да има много сложна конфигурация (тя е област в многомерно пространство). Вместо това се построява някаква статистика , която е функция на компонентите на извадката. Тогава проверката  се заменя с проверката: . Последното равенство се отнася до образа на критичната област чрез статистиката . Тази проверка е много по-лесна, защото се свежда обикновено до проверката за принадлежност на едно реално число към някакъв интервал. Такава статистика се нарича статистика, на основата на която се строи критерият (за проверка на нулевата хипотеза). Разбира се, не всяка статистика  е подходяща за построяване на критерий за проверка.

Общата теория на критериите излиза извън рамките на този курс. Засега ще се ограничим с тези най-общи бележки и ще разгледаме няколко примера за най-често използувани конкретни критерии.