Štatistickou hypotézou nazývame každý predpoklad, alebo výrok, ktorý sa týka celého základného súboru. Overovanie hypotéz na základe výsledkov pokusu je dôležitou súčasťou matematiky.

Overovanie štatistickej hypotézy spočíva v testovaní správnosti nášho predpokladu na základe náhodného výberu.

Základnú, nulovú, hypotézu označujeme H0a je to hypotéza, ktorú overujeme (testujeme). Oproti nej staviame alternatívnu hypotézu H1a je to vlastne druhá možnosť, ktorú uvažujeme v prípade, že nulová hypotéza neplatí.


 

Postup pri testovaní štatistických hypotéz:

1. Formulácia nulovej hypotézy - H0.Výsledným cieľom pri väčšine štatistických testov je zhodnotenie vzťahu medzi premennými – H0 potom vyjadruje nezávislosť premenných.

Príklad H0: Žiaci 4.A budú v testovaní z matematiky rovnako úspešní ako žiaci z 4.B.

 

2. Formulácia alternatívnej hypotézy - H1: Nemusí byť jednoduchou negáciou H0, môže v sebe zahŕňať iba určitú časť možností, ktoré prichádzajú do úvahy v prípade, že H0 neplatí. Teda, napr. H1môže mať tvar:

- Žiaci 4.A. budú v testovaní z matematiky úspešnejší ako žiaci 4.B.

alebo:

-Žiaci 4.B. budú v testovaní z matematiky buď menej alebo viac úspešní ako žiaci 4.B.

Pravdivosť H1 sa dokazuje vždy iba nepriamo - tak, že ukážeme, že H0 je nepravdepodobná a alternatívna - jediná zostávajúca- je tak pravdepodobná. H1 najčastejšie vyjadruje štatistickú závislosť premenných – a väčšinou pravdivosť tejto hypotézy chceme dokázať.


3. Stanovenie hladiny významnosti –α

Nakoľko overovanie štatistických hypotéz sa zakladá na skúmaní výberových súborov, podlieha aj náhodným chybám. Tieto voláme chyby prvého (I.) druhého (II.)druhu.

Hladina významnosti je pravdepodobnosť chyby I. druhu. Túto urobíme v prípade, že zamietneme H0 , ktorá v skutočnosti platí. Teda vtedy, ak prídeme k záveru, že medzi premennými existuje vzťah, i keď medzi nimi vzťah nie je.

Hladina významnosti sa stanovuje na 5 % (t.j. 0,05) alebo 1 %.

Pravdepodobnosť chyby II. druhu značíme β a potom doplnkovú pravdepodobnosť voláme sila testu a označujeme ju 1 – β.

Obidve chyby sú nepriamo úmerné, teda, ak α sa približuje k 1, β sa približuje k 0, vždy sa pevne zvolí hladina významnosti α a na tejto hladine sa následne minimalizuje β.


 

Pri testovaní štatistických hypotéz môžu nastať tieto situácie:

 

 

 

 

rozhodnutie

skutočnosť


H0 pravdivá

H0 nepravdivá

nezamietnutá H0

p = 1 - α

p = β; chyba 2.druhu

zamietnutá H0

p = α; chyba 1. druhu

p = 1 - β

 

H0 a H1 sú:

  • navzájom disjunktné, teda sa vylučujú

len jedna môže byť pravdivá.

  • vyčerpávajúce

spolu pokrývajú všetky možnosti tak, že jedna alebo druhá musí byť pravdivá.


4.) Výpočet testovacej štatistiky a pravdepodobnosti. Zo vzorky sa počíta testovacia štatistika, ktorá má za predpokladu pravdivosti H0 primerané rozdelenie.

P - hodnota je:

  • pravdepodobnosť, že vzťah, ktorý sme zistili z našich údajov je len dôsledkom nešťastnej vzorky a že v prípade, že by sme vybrali ďalšiu náhodnú vzorku, nemuseli by sme nájsť nič.  

  • najnižšia hodnota hladiny významnosti vedúca k zamietnutiu nulovej hypotézy

  • odhadovaná pravdepodobnosť zamietnutia pravdivej H0 . Čím je hodnota P menšia, tým viac sme presvedčení, že H0 nie je pravdivá a teda by mala byť zamietnutá.


5.) Rozhodnutie

Existujú dva možné stavy:

H0 je pravdivá

H0 je nepravdivá