Testování hypotéz |
prev | home | next |
Skončilo důkazové řízení, promluvil svou závěrečnou řečí státní zástupce, tečku za projednáváním udělal obhájce obžalovaného svým závěrečným výstupem. Projednávala se kauza jedné vraždy. Obžalovaný nebyl přichycen při činu a za celou dobu se k vraždě nepřiznal. Žalobou bylo jen sneseno určité množství nepřímých důkazů, indicií, které byly obhajobou zpochybňovány.
Soudce odročil řízení na druhý den, kdy vynese rozsudek. Obžalovaného odvedli do vazby a ostatní se rozešli po svých povinnostech nebo zábavě. Soudce se zavřel ve své kanceláři a naposledy se ponořil do případu. Musí zvážit všechna předložená tvrzení a na jejich základě rozhodnout. Patří obžalovaný mezi bezúhonné občany a důkazní události jsou jen náhodné smolné jevy? Nebo patří mezi vrahy a zpochybňování týž jevů je jen nedostatečností jejich zjištění a předložení?
Ideální soudce musí vycházet z presumce neviny. To znamená, musí předpokládat, že obžalovaný je řádný občan, a že předestřené události vznikly pouhou nešťastnou náhodou.
Pokud by takového bezúhonného občana odsoudil, tj. nevinného by poslal do těžkého žaláře (nebo na smrt), dopustil by se chyby 1. druhu, kterou charakterizuje oblast s pravděpodobností α.
Na druhé straně může být obžalovaný skutečně vrahem a jen náhoda tomu chce, že mu to nelze s plnou zodpovědností dokázat.
Nyní hrozí chyba 2. druhu, charakterizovaná oblastí s pravděpodobností β. Znamenalo by to propustit viníka na svobodu.
V ideální společnosti platí, že výskyt chyby 1. druhu (nevinně odsouzený) je nežádoucí; je společensky neúnosná. Chyba 2. druhu (viník propuštěn) je pokládána za méně nebezpečnou. (Že je mínění některých spoluobčanů opačné, neodpovídá evropské morálce.) Proto se snažíme chybu 1. druhu co nejvíce zmenšit. Snažíme se minimalizovat chybu 1. druhu.
Právě popsané úvahy musí provádět nejen soudce, ale i ekonom, lékař, sociolog, a mnoho dalších profesí. Někdy jde při tom opravdu o život, někdy jen o majetek.
Bedna 100 000 ks výrobků obsahuje určitou část zmetků a my se musíme rozhodnout, jestli bednu přijmout a zaplatit nebo zásilku vrátit. Udělat 100% kontrolu je příliš nákladné (šrouby) nebo nemožné (sirky, rakety – kontrola znamená zničení). I provedeme náhodný výběr (například 50 ks) a ten podrobíme stoprocentní kontrole (zjistíme indicie: ve výběru je t % zmetků).
Nyní se musíme rozhodnout. Když výrobky odmítneme a v bedně je přitom zmetků v množství, které jsme ochotni tolerovat, dopustíme se chyby 1. druhu („nevinné“ výrobky prohlásíme za zmetky) – dodavatel bude láteřit, ale své výrobky prodá jinde. Naopak když výrobky přijmeme a přesto v bedně bude více zmetků než jsme ochotni tolerovat, dopustíme se chyby 2. druhu (přijmeme zmetky) – dodavatel bude spokojen, ale my budeme mít škodu.
Princip testování statistických hypotéz je založen na následující úvaze: Předpokládáme, že sledovaná náhodná veličina X má jisté pravděpodobnostní rozdělení. Dostaneme nějaký náhodný výběr, o kterém se předpokládá, že odpovídá rozdělení X (nulová hypotéza). Určíme předem (!) číslo α, které pokládáme ještě za věrohodné při jednorázovém provedení.
Pak prošetříme kritické případy v náhodném výběru (získáme pravděpodobnost t) a pokud jejich pravděpodobnost překročí hranici α (t > α), pokládáme za prakticky nemožné, že by při jednorázovém provedení výběru mohl takový případ nastat a nulovou hypotézu zamítáme (výběr není z rozdělení veličiny X) a přikláníme se k alternativní hypotéze (výběr je z jiného rozdělení). A to i přes to, že je možná pravdivá (α – chyba 1. druhu).
α se nazývá hladina významnosti a volí se podle závažnosti tradičně α = 0,001 (0,1 %), α = 0,01 (1 %) a α = 0,05 (5 %). Říkáme, že statistický test proběhl na hladině významnosti 5 % nebo že je statisticky signifikantní na hladině 5 %. |
Jeden případ jsme již uvedli dříve Problém nákazy skotu, nyní jako ilustraci uvedeme následující.
Mirek hodil 30 krát mincí a padlo mu 21_krát rub a 9_krát líc. Vkrádá se pochybnost, zda Mirek házel ideální mincí. Předpokládejme, že jde skutečně o náhodu a házelo se ideální mincí a padnutí rubu při jednom hodu má pravděpodobnost p = 0,5 (tzv. nulová hypotéza) a náhodná veličina X značící počet rubů má binomické rozdělení X ~ Bi(30; 0,5). Ideálnost hrací mince je důležitá, proto budeme testovat na hladině významnosti 1 %.
Pravděpodobnost nastání popsaného případu je t = 1,5 %. Podobný případ nastane 3 krát v 200 sériích hodů s ideální mincí. Pokládáme za prakticky nemožné, aby takový případ jednorázově nastal. Proto odmítáme hypotézu, že Mirek házel ideální symetrickou mincí. Jinak: použitá mince není ideální na hladině významnosti a = 1 %.
Poznámka: Poslední výpočet byl proveden aproximativně. Binomické rozdělení B(n, p) bylo nahrazeno (n≥30) normálním rozdělením N(μ = np, σ2 = npq)