Úvodní stránka | Tato stránka v originále

Ovlivnit (statistiky)

V statistikách, slovo zaujatost má přinejmenším dva různé smysly, jeden odkazovat se na něco zvážil to velice špatný, jiný odkazovat se na něco to je občas žádoucí. Oba znamenají to odhadce z nějakého důvodu v průměru přes - nebo podceňovat co je bytí odhadovalo.

Tabulka s obsahem
1 špatný druh
2 někdy-dobrý druh
3 vidět také

Špatný druh

Jeden význam je zapojený do čeho je volán ovlivnil vzorek: Jestliže některé elementy více pravděpodobně jsou vybrány ve vzorku než jiní, a ti to být mít vyšší nebo nižší hodnotu kvantity bytí odhadlo, výsledek bude vyšší nebo nižší než skutečná cena.

Slavný případ čeho může zkazit se když používá zaujatý vzorek je nalezený v 1936 amerických prezidentských volbách hlasování. Literární přehled držel hlasování, které předpovídalo, že Alfred E. Landon by zrušil Franklin Delano Roosevelt 57 % k 43 %. George Gallup, používat mnohem menší vzorek (300,000 poněkud než 2,000,000), předpovídal Roosevelt by vyhrál a on byl pravý. Co se zkazilo se Literárním přehledovým hlasováním? Oni měli použité seznamy telefonu a vlastníky automobilu vybrat jejich vzorek. V té době, tito byli přepychy, tak jejich vzorek sestával se hlavně středa - a horní občané. Tito zvolili většinu pro Landona, ale nižší třídy hlasovaly pro Roosevelt. Protože jejich vzorek byl zaměřený na bohatější občany, jejich výsledek byl nesprávný.

Tento druh zaujatosti je obvykle považován za horší problém než statistický hluk: Problémy se statistickým hlukem mohou být zmenšeny tím, že zvětší vzorek ale zaujatý vzorek neodjede to snadno. Zvláště, meta-analýza bude pálit dobrá data pro studia že sám trpí statistickým hlukem ale meta-analýza zaujatých studií bude ovlivnil sebe.

Někdy-dobrý druh

Další druh zaujatosti ve statistikách nezahrnuje zaujaté vzorky ale laně zahrnovat použití statistiky jehož průměrná hodnota se liší od hodnoty kvantity bytí odhadovalo. Například, předpokládat 1, ..., Xn jsou nezávislá osoba a totožně distribuované náhodné proměnné, každý s normální distribucí s očekáváním a mu; a rozdílnost a sigma;2. Nechaný

být “výběrový průměr”, a nechaný
být “výběrový rozptyl”. Pak S2 je “zaujatý odhadce” a sigma;2 protože
Nicméně, tento zaujatý odhadce je, běžně používaným kritériem “zlé čtvercové chyby”, vlastně lepší (ale jediný velmi mírně) než nezaujatý odhadce, který vyplývá z umístění n a bez; 1 ve jmenovateli kde n se objeví v definici S2 nahoře. Dokonce pak druhá odmocnina nezaujatého odhadce populace rozdílnost není nezaujatý odhadce populace směrodatná odchylka; pro nelineární funkci f a nezaujatý odhadce U parametru p, f(U) je obvykle ne nezaujatý odhadce f(p).

Daleko extrémnější případ zaujatého odhadce být lepší než nějaký nezaujatý odhadce je známý: Předpokládat XPoisson distribuce s očekáváním a lambda;. To je požadované k odhadu

Jediná funkce dat představovat nezaujatého odhadce je
Jestliže pozorovaná hodnota X je 100, pak odhad je 1, ačkoli pravdivá hodnota bytí kvantity odhadla je zřejmě velmi pravděpodobný, že je blízký 0, který je extrém opaku. A jestliže X je sledován být 101, pak odhad je dokonce více nesmyslný: to je - 1, ačkoli bytí kvantity odhadlo zřejmě muset být pozitivní. (Zaujatý) maximum-odhadce pravděpodobnosti
je hodně lépe než tento nezaujatý odhadce.

Viz též