Úvodní stránka | Tato stránka v originále

Normální distribuce

normální distribuce je extrémně důležitý rozdělení pravděpodobnosti v mnoha polích. To je také nazýváno Gaussian distribucí. To je vlastně rodina distribucí stejné obecné formy, se lišit jediný v jejich umístění a zmenšených parametrech: zlý a směrodatná odchylka. standardní normální distribuce je normální distribuce s zlý nuly a směrodatná odchylka jeden. Protože graf jeho hustoty pravděpodobnosti se podobá zvonku, to je často nazýváno křivkou zvonku.

Tabulka s obsahem
1 historie
2 specifikace normální distribuce
3 vlastnosti
4 výskyt
5 další četby
6 externí odkazy a odkazy

Historie

Normální distribuce byla nejprve představena tím, že de Moivre v článku v 1733 (dotisknutý ve druhém jeho vydání Doktrína šancí, 1738) v souvislosti s dotykovými jistými binomickýma distribucemi pro velký n. Jeho výsledek byl rozšířen Laplace v jeho knize Analytická teorie pravděpodobnosti (1812), a je nyní nazýván teorémem de Moivre-Laplace.

Laplace používal normální distribuci v analýze chyb experimentů. Důležitý metoda nejméně čtverců byla představena Legendreem v 1805. Gauss, kdo prohlašoval k použili metodu protože 1794, ospravedlnil to pečlivě v 1809 tím, že převezme normální distribuci chyb.

Jméno “křivka zvonku” se vrátí k Jouffret kdo používal termín “povrch zvonku” v 1872 pro bivariate normální s nezávislými složkami. Jméno “normální distribuce” byla vytvořena nezávisle Charles S. Peirce, Francis Galton a Wilhelm Lexis kolem 1875 [Stigler]. Tato terminologie je nešťastná od té doby, co to přemýšlí a povzbuzuje klam, že “všechno je Gaussian”. (vidět diskuzi o “výskytu” dole).

Specifikace normální distribuce

Tam jsou různé způsoby, jak specifikovat náhodnou proměnnou. Nejvíce vizuální je funkce hustoty pravděpodobnosti (spiknutí na špici), který reprezentuje jak pravděpodobně každá hodnota náhodné proměnné je. Narůstající hustota rozložení je pojmově čistější způsob, jak specifikovat stejné informace, ale k netrénovanému oku jeho výkres je hodně méně poučný (vidět dolů). Rovnocenné způsoby, jak specifikovat normální distribuci jsou: momenty, cumulants, charakteristická funkce, moment-tvořit funkci, a cumulant -tvořit funkci. Někteří tito jsou velmi užiteční pro teoretickou práci, ale ne intuitivní. Viďte rozdělení pravděpodobnosti pro diskuzi.

Všichni cumulants normální distribuce být nulový, kromě první dva.

Funkce hustoty pravděpodobnosti

funkce hustoty pravděpodobnosti normální distribuce s zlý a mu; a směrodatná odchylka a sigma; (equivalently, rozdílnost a sigma;2) je příklad Gaussian funkce,

(Vidět také exponenciální funkce a pi.) jestliže náhodná proměnná X má tato distribuce, my píšeme X ~ N (a mu;, a sigma;2). Jestliže a mu; = 0 a a sigma; = 1, distribuce je nazývána standardní normální distribucí, s rovnicí

Obraz u vrcholu tohoto článku je graf funkce hustoty pravděpodobnosti standardní normální distribuce.

Pro všechny normální distribuce, hustota rozložení je symmetric o jeho střední hodnotě. Asi 68 % oblasti dolů křivka je uvnitř jedné standardní odchylky zlý, 95.5% uvnitř dvou standardních odchylek, a 99.7% uvnitř tří standardních odchylek. obratové body křivky nastat u jedné standardní odchylky pryč od zlý.

Narůstající distribuční funkce

narůstající distribuční funkce (budoucnost cdf) je definován jako pravděpodobnost to proměnná X má hodnotu méně než x, a to je vyjádřeno v podmínkách hustoty rozložení jak

Standardní normální cdf, konvenčně označil, je jen generál cdf ocenil s a,

Standardní normální cdf mohou být vyjádřeny v podmínkách základní funkce volal funkci chyby, jak

Následující graf ukazuje narůstající distribuční funkci pro hodnoty z od - 4 k + 4:

Na tomto grafu, my vidíme pravděpodobnost že standardní normální proměnná má hodnotu méně než 0.25 je přibližně rovnat se k 0.60.

Funkce buzení

Moment tvořit funkci

Charakteristická funkce

charakteristická funkce je definována jako finanční efekt . Pro normální distribuci, to může být ukazováno charakteristická funkce je

jak moci být viděn tím, že dokončí čtverec v exponentu.

Vlastnosti

  1. Jestliže X ~ N (a mu;, a sigma;2) a a b být reálná čísla, pak sekyra + b ~ N (a mu; + b, (a sigma;)2).
  2. Jestliže X1 ~ N (a mu;1, a sigma;12) a X2 ~ N (a mu;2, a sigma;22), a X1 a X2 být nezávislý, pak X1 + X2 ~ N (a mu;1 + a mu;2, a sigma;12 + a sigma;22).
  3. Jestliže X1,..., Xn být nezávislý standardní normální proměnné, pak X12 +... + Xn2chi-čtvercová distribuce s n míry svobody.

Normalizovat normální náhodné proměnné

Jako důsledek vlastnictví 1, to je možné líčit všechny normální náhodné proměnné ke standardu normální.

Jestliže X je normální náhodná proměnná s zlý a mu; a rozdílnost a sigma;2, pak

je standardní normální náhodná proměnná: Z~ N (0, 1). An důležitý následek je že cdf obecné normální distribuce je proto

Naopak, jestliže Z je standardní normální náhodná proměnná,

je normální náhodná proměnná s zlý a mu; a rozdílnost a sigma;2.

Standardní normální distribuce byla tabelovaná a jiné normální distribuce jsou jednoduché transformace toho standardního. Proto, jeden může používat tabelované hodnoty cdf standardní normální distribuce najít hodnoty cdf obecné normální distribuce.

Tvořit normální náhodné proměnné

Pro modelování na počítačích, to je často užitečné tvořit hodnoty, které mají normální distribuci. Tam je několik metod; nejzákladnější je invertovat standardní normální cdf. Více účinných metod je také známé. Jedna taková metoda je Boxovat-Muller převádí. Krabice-Muller převádí bere dva jednotně distribuované hodnoty jako vstup a mapy je ke dvěma normálně distribuovaným hodnotám. Toto potřebuje produkovat hodnoty z jednotné distribuce, pro kterého mnoho metod je znáno. Viz též generátory náhodného čísla.

Krabice-Muller převádí je důsledek vlastnictví 3 a skutečnost, že chi-distribuce čtverce se dvěma mírami svobody je exponenciální náhodná proměnná (který jde snadno vytvářet).

Centrální limitový teorém

Normální distribuce má velmi důležitou vlastnost to pod určitými podmínkami, distribuce sumy velkého množství nezávislých proměnných je přibližně normální. Toto je takzvaný centrální limitový teorém.

Praktický význam centrálního limitového teoréma je že normální distribuce může být používána jako přiblížení k některým jiným distribucím.

Zda tato přiblížení jsou dostatečně přesná závisí na účelu pro kterého oni jsou potřebováni, a rychlost sbližování k normální distribuci. To je typicky případ že taková přiblížení jsou méně přesná v ocasech distribuce.

Výskyt

Přibližně normální distribuce se vyskytují v mnoha situacích, v důsledku centrálního limitového teoréma. Když tam je důvod podezřívat přítomnost z velkého množství malých efektů hrát additively, to je rozumné předpokládat, že pozorování budou normální. Tam jsou statistické metody k empiricky vyzkoušet tu domněnku.

Účinky mohou také fungovat jako multiplikativní (poněkud než přísada) modifikace. V tom případě, předpoklad o normálnosti není oprávněný a to je logaritmus proměnné zájmu, který je normálně distribuovaný. Distribuce přímo pozorované proměnné je pak nazvaná žurnál-normální.

Konečně, jestliže tam je jediný vnější vliv, který má velký účinek na proměnnou v úvaze, předpoklad o normálnosti není oprávněný jeden. Toto je pravdivé dokonce jestliže, když externí proměnná je držená konstanta, výsledné distribuce jsou opravdu normální. Plná distribuce bude superpozice normálních proměnných, který není obecně normální. Toto je příbuzné teorii chyb (vidět dolů).

Shrnovat, tady je seznam situací kde přibližná normálnost je někdy převzata. Pro plnější diskuzi, viďte dolů.

Důležitosti pro biologii a ekonomiku je skutečnost, že složité systémy inklinují k displejovým elektrickým právům poněkud než normálnost.

Počty fotonu

Svítivost od jediného zdroje se mění s časem, a je obvykle převzat být normálně distribuovaný. Nicméně, kvantová mechanika interpretuje měření svítivosti jak foton počítat. Obyčejné světelné zdroje, které produkují světlo tepelnou emisí, should následovat Poisson distribuci nebo Bose-Einstein distribuce na velmi krátkých časových mírách. Na delších časových mírách (delší než čas souvislosti), přidání nezávislých proměnných vydá přibližně normální distribuci. Intenzita laserového světla, který je kvantový jev, má přesně normální distribuce.

Chyby měření

Opakovaná měření stejné kvantity jsou očekávána k výsledkům výnosu, které jsou sdružené kolem zvláštní hodnoty. Jestliže všechny hlavní zdroje chyb byly zaujaté do účtu, to je považované že zbývající chyba musí být výsledek velkého množství velmi malý adiční efekty, a od této doby normální. Odchylky od normálnosti jsou interpretovány jako znamení soustavných chyb, které nebyly vzaty do účtu. Poznamenat, že toto je centrální předpoklad matematické teorie chyb.

Fyzikální charakteristiky biologických vzorků

Ohromující biologický důkaz je ten velký růst procesy žijící tkáně pokračují multiplikativní, ne přísada, inkrementy, a že proto míry kuželky písmena by měly u nejvíce následovat lognormal poněkud než normální distribuce. Přes obyčejné požadavky normálnosti, velikosti rostlin a zvířata je přibližně lognormal. Důkaz a vysvětlení založené na modelech růstu byli nejprve vydáváni v klasické knize

Huxley, Julian: Problémy růstu příbuzného (1932)

Rozdíly ve velikosti náležitý k sexuálnímu dimorfismu nebo jiným polymorphisms jako pracovník/voják/divize královny ve společenském hmyzu, dále provádět spojenou distribuci velikostí se odchýlit od lognormality.

Předpoklad, že lineární velikost biologických vzorků je normální vedení k non-normální distribuce váhy (od váhy/hlasitost je ostře 3. síla délky a distribuce gaussian jsou jen chráněny lineárními transformacemi), a naopak předpokládat, že váha je normální vedení k non-normální délky. Toto je problém, protože není tam žádný priori důvod proč jeden z délky nebo tělo se hromadí, a ne jiný, should být normálně distribuovaný. Lognormal distribuce, na druhé straně, být chráněn sílami tak “problém” odjede jestliže lognormality je převzat.

Finanční proměnné

Protože exponenciální povahy zájmu a inflace, finanční indikátory takový jako zájmové míry, akciové hodnoty nebo druh zboží ceny dělají dobré příklady multiplikativního chování. Jako takový, oni by neměli být čekal, že je normální, ale lognormal.

Mandelbrot, popularizer fraktálů, prohlašoval, že dokonce předpoklad lognormality je vadný.

Celý život

Jiné příklady proměnných, které jsou ne normálně rozdělil zahrnovat celé životy lidí nebo mechanická zařízení. Příklady distribucí používaných v tomto spojení jsou exponenciální distribuce (memoryless) a Weibull distribuce. Obecně, není tam žádný důvod to čekací doby by měly být normální od té doby, co oni nejsou přímo příbuzní nějakému druhu vlivu přísady.

Skóre testu

Skóre IQ jednotlivce například může být viděno jako výsledek mnoha malých přídavných vlivů: mnohé geny a mnoho faktorů životního prostředí všichni hrají roli.

Kritiky: skóre testu jsou nespojitá veličina spojená s množstvím správných/nesprávných odpovědí a jako takový oni jsou příbuzní dvojčlenu. Navíc (vidět tuto USENET poštu), surový skóre testu inteligence jsou obvykle ' masírovaný ' nutit distribuci skóre IQ být normální. Konečně, není tam žádný široce přijímaný model inteligence a spojení na skóre IQ nechalo osamoceně vztah mezi vlivy na inteligenci a adiční variace IQ, je podřízený debatě.

Další četba

Vnější spojení a odkazy