Normální distribuce
normální distribuce je extrémně důležitý rozdělení pravděpodobnosti v mnoha polích. To je také nazýváno Gaussian distribucí. To je vlastně rodina distribucí stejné obecné formy, se lišit jediný v jejich umístění a zmenšených parametrech: zlý a směrodatná odchylka. standardní normální distribuce je normální distribuce s zlý nuly a směrodatná odchylka jeden. Protože graf jeho hustoty pravděpodobnosti se podobá zvonku, to je často nazýváno křivkou zvonku.
Normální distribuce byla nejprve představena tím, že de Moivre v článku v 1733 (dotisknutý ve druhém jeho vydání Doktrína šancí, 1738) v souvislosti s dotykovými jistými binomickýma distribucemi pro velký n. Jeho výsledek byl rozšířen Laplace v jeho knize Analytická teorie pravděpodobnosti (1812), a je nyní nazýván teorémem de Moivre-Laplace.
Laplace používal normální distribuci v analýze chyb experimentů. Důležitý metoda nejméně čtverců byla představena Legendreem v 1805. Gauss, kdo prohlašoval k použili metodu protože 1794, ospravedlnil to pečlivě v 1809 tím, že převezme normální distribuci chyb.
Jméno “křivka zvonku” se vrátí k Jouffret kdo používal termín “povrch zvonku” v 1872 pro bivariate normální s nezávislými složkami. Jméno “normální distribuce” byla vytvořena nezávisle Charles S. Peirce, Francis Galton a Wilhelm Lexis kolem 1875 [Stigler]. Tato terminologie je nešťastná od té doby, co to přemýšlí a povzbuzuje klam, že “všechno je Gaussian”. (vidět diskuzi o “výskytu” dole).
Specifikace normální distribuce
Tam jsou různé způsoby, jak specifikovat náhodnou proměnnou. Nejvíce vizuální je funkce hustoty pravděpodobnosti (spiknutí na špici), který reprezentuje jak pravděpodobně každá hodnota náhodné proměnné je. Narůstající hustota rozložení je pojmově čistější způsob, jak specifikovat stejné informace, ale k netrénovanému oku jeho výkres je hodně méně poučný (vidět dolů). Rovnocenné způsoby, jak specifikovat normální distribuci jsou: momenty, cumulants, charakteristická funkce, moment-tvořit funkci, a cumulant -tvořit funkci. Někteří tito jsou velmi užiteční pro teoretickou práci, ale ne intuitivní. Viďte rozdělení pravděpodobnosti pro diskuzi.
Všichni cumulants normální distribuce být nulový, kromě první dva.
Funkce hustoty pravděpodobnosti
funkce hustoty pravděpodobnosti normální distribuce s zlý a mu; a směrodatná odchylka a sigma; (equivalently, rozdílnost a sigma;2) je příklad Gaussian funkce,
Pro všechny normální distribuce, hustota rozložení je symmetric o jeho střední hodnotě. Asi 68 % oblasti dolů křivka je uvnitř jedné standardní odchylky zlý, 95.5% uvnitř dvou standardních odchylek, a 99.7% uvnitř tří standardních odchylek. obratové body křivky nastat u jedné standardní odchylky pryč od zlý.
Narůstající distribuční funkce
narůstající distribuční funkce (budoucnost cdf) je definován jako pravděpodobnost to proměnná X má hodnotu méně než x, a to je vyjádřeno v podmínkách hustoty rozložení jak
Na tomto grafu, my vidíme pravděpodobnost že standardní normální proměnná má hodnotu méně než 0.25 je přibližně rovnat se k 0.60.
charakteristická funkce je definována jako finanční efekt . Pro normální distribuci, to může být ukazováno charakteristická funkce je
- Jestliže X ~ N (a mu;, a sigma;2) a a b být reálná čísla, pak sekyra + b ~ N (a mu; + b, (a sigma;)2).
- Jestliže X1 ~ N (a mu;1, a sigma;12) a X2 ~ N (a mu;2, a sigma;22), a X1 a X2 být nezávislý, pak X1 + X2 ~ N (a mu;1 + a mu;2, a sigma;12 + a sigma;22).
- Jestliže X1,..., Xn být nezávislý standardní normální proměnné, pak X12 +... + Xn2 má chi-čtvercová distribuce s n míry svobody.
Normalizovat normální náhodné proměnné
Jako důsledek vlastnictví 1, to je možné líčit všechny normální náhodné proměnné ke standardu normální.
Jestliže X je normální náhodná proměnná s zlý a mu; a rozdílnost a sigma;2, pak
Standardní normální distribuce byla tabelovaná a jiné normální distribuce jsou jednoduché transformace toho standardního. Proto, jeden může používat tabelované hodnoty cdf standardní normální distribuce najít hodnoty cdf obecné normální distribuce.
Tvořit normální náhodné proměnné
Pro modelování na počítačích, to je často užitečné tvořit hodnoty, které mají normální distribuci. Tam je několik metod; nejzákladnější je invertovat standardní normální cdf. Více účinných metod je také známé. Jedna taková metoda je Boxovat-Muller převádí. Krabice-Muller převádí bere dva jednotně distribuované hodnoty jako vstup a mapy je ke dvěma normálně distribuovaným hodnotám. Toto potřebuje produkovat hodnoty z jednotné distribuce, pro kterého mnoho metod je znáno. Viz též generátory náhodného čísla.
Krabice-Muller převádí je důsledek vlastnictví 3 a skutečnost, že chi-distribuce čtverce se dvěma mírami svobody je exponenciální náhodná proměnná (který jde snadno vytvářet).
Normální distribuce má velmi důležitou vlastnost to pod určitými podmínkami, distribuce sumy velkého množství nezávislých proměnných je přibližně normální. Toto je takzvaný centrální limitový teorém.
Praktický význam centrálního limitového teoréma je že normální distribuce může být používána jako přiblížení k některým jiným distribucím.
- distribuce dvojčlena s parametry n a p je přibližně normální pro velký n a p ne příliš blízký k 1 nebo 0. Dotyková normální distribuce má zlý a mu; = np a směrodatná odchylka a sigma; = (n p (1 - p))1/2.
- Poisson distribuce s parametrem a lambda; je přibližně normální pro velký a lambda;. Dotyková normální distribuce má zlý a mu; = a lambda; a směrodatná odchylka a sigma; = a radic; a lambda;.
Výskyt
Přibližně normální distribuce se vyskytují v mnoha situacích, v důsledku centrálního limitového teoréma. Když tam je důvod podezřívat přítomnost z velkého množství malých efektů hrát additively, to je rozumné předpokládat, že pozorování budou normální. Tam jsou statistické metody k empiricky vyzkoušet tu domněnku.
Účinky mohou také fungovat jako multiplikativní (poněkud než přísada) modifikace. V tom případě, předpoklad o normálnosti není oprávněný a to je logaritmus proměnné zájmu, který je normálně distribuovaný. Distribuce přímo pozorované proměnné je pak nazvaná žurnál-normální.
Konečně, jestliže tam je jediný vnější vliv, který má velký účinek na proměnnou v úvaze, předpoklad o normálnosti není oprávněný jeden. Toto je pravdivé dokonce jestliže, když externí proměnná je držená konstanta, výsledné distribuce jsou opravdu normální. Plná distribuce bude superpozice normálních proměnných, který není obecně normální. Toto je příbuzné teorii chyb (vidět dolů).
Shrnovat, tady je seznam situací kde přibližná normálnost je někdy převzata. Pro plnější diskuzi, viďte dolů.
- V problémech počítání (tak centrální limitový teorém obsahuje jednotlivý-k-přiblížení kontinua) kde reprodukční náhodné proměnné jsou zahrnovány, takový jak
- Binomické náhodné proměnné, spojený k ano/žádné otázky;
- Poisson náhodné proměnné, kolegové ke vzácným událostem;
- Ve fyziologických měřeních biologických vzorků:
- logaritmus mír velikosti žijící tkáně (délka, výška, oblast kůže, váha);
- délka nehybných přídavků (vlasy, drápy, hřebíky, zuby) biologických vzorků, ve směru růstu; pravděpodobně tloušťka stromové kůry také padá v této kategorii;
- Jiné fyziologické míry mohou být normálně distribuované, ale není tam žádný důvod očekávat, že priori;
- Chyby měření jsou považované být normálně distribuovaný, a nějaká odchylka fron normálnost musí být vysvětlena;
- Finanční proměnné
- logaritmus zaujmout míry, devizové kurzy a inflaci; tyto proměnné se chovají jako složitý úrok, ne jako jednoduchý úrok, a tak být multiplikativní;
- Akcie-indexy trhu mají být multiplikativní příliš, ale někteří výzkumníci prohlašují, že oni jsou žurnál-Lévy proměnné místo toho, aby lognormal;
- Jiné finanční proměnné mohou být normálně distribuované, ale není tam žádný důvod očekávat, že priori;
- Svítivost
- Intenzita světla laseru je normálně distribuovaná;
- Teplotní světlo má Bose-Einstein distribuce na velmi krátkých časových mírách a normální distribuci na delších časových rámcích náležitý k centrálnímu limitovému teorému.
Svítivost od jediného zdroje se mění s časem, a je obvykle převzat být normálně distribuovaný. Nicméně, kvantová mechanika interpretuje měření svítivosti jak foton počítat. Obyčejné světelné zdroje, které produkují světlo tepelnou emisí, should následovat Poisson distribuci nebo Bose-Einstein distribuce na velmi krátkých časových mírách. Na delších časových mírách (delší než čas souvislosti), přidání nezávislých proměnných vydá přibližně normální distribuci. Intenzita laserového světla, který je kvantový jev, má přesně normální distribuce.
Opakovaná měření stejné kvantity jsou očekávána k výsledkům výnosu, které jsou sdružené kolem zvláštní hodnoty. Jestliže všechny hlavní zdroje chyb byly zaujaté do účtu, to je považované že zbývající chyba musí být výsledek velkého množství velmi malý adiční efekty, a od této doby normální. Odchylky od normálnosti jsou interpretovány jako znamení soustavných chyb, které nebyly vzaty do účtu. Poznamenat, že toto je centrální předpoklad matematické teorie chyb.
Fyzikální charakteristiky biologických vzorků
Ohromující biologický důkaz je ten velký růst procesy žijící tkáně pokračují multiplikativní, ne přísada, inkrementy, a že proto míry kuželky písmena by měly u nejvíce následovat lognormal poněkud než normální distribuce. Přes obyčejné požadavky normálnosti, velikosti rostlin a zvířata je přibližně lognormal. Důkaz a vysvětlení založené na modelech růstu byli nejprve vydáváni v klasické knize
- Huxley, Julian: Problémy růstu příbuzného (1932)
Předpoklad, že lineární velikost biologických vzorků je normální vedení k non-normální distribuce váhy (od váhy/hlasitost je ostře 3. síla délky a distribuce gaussian jsou jen chráněny lineárními transformacemi), a naopak předpokládat, že váha je normální vedení k non-normální délky. Toto je problém, protože není tam žádný priori důvod proč jeden z délky nebo tělo se hromadí, a ne jiný, should být normálně distribuovaný. Lognormal distribuce, na druhé straně, být chráněn sílami tak “problém” odjede jestliže lognormality je převzat.
- krevní tlak dospělých lidí má být normálně distribuovaný, ale jediný poté, co oddělil muže a ženy do různých populací (každý který je normálně distribuovaný)
- Délka nehybných přídavků takový jako vlasy, hřebíky, teet, drápy a shelly je čekal, že je normálně distribuovaný jestliže uměřený ve směru růstu. Toto je, protože nárust nehybných přídavků závisí na velikosti kořenu, a ne na délce přídavku, a tak pokračuje adičními inkrementy. Proto, my máme příklad součtu velmi mnoho malých lognormal inkrementů přibližující se normální distribuce. Další pravděpodobný příklad je šířka kmenů, kde nový tenký prsten jestliže produkoval každý rok jehož šířka je postižená velkým množstvím faktorů.
Finanční proměnné
Protože exponenciální povahy zájmu a inflace, finanční indikátory takový jako zájmové míry, akciové hodnoty nebo druh zboží ceny dělají dobré příklady multiplikativního chování. Jako takový, oni by neměli být čekal, že je normální, ale lognormal.
Mandelbrot, popularizer fraktálů, prohlašoval, že dokonce předpoklad lognormality je vadný.
Jiné příklady proměnných, které jsou ne normálně rozdělil zahrnovat celé životy lidí nebo mechanická zařízení. Příklady distribucí používaných v tomto spojení jsou exponenciální distribuce (memoryless) a Weibull distribuce. Obecně, není tam žádný důvod to čekací doby by měly být normální od té doby, co oni nejsou přímo příbuzní nějakému druhu vlivu přísady.
Skóre IQ jednotlivce například může být viděno jako výsledek mnoha malých přídavných vlivů: mnohé geny a mnoho faktorů životního prostředí všichni hrají roli.
- Skóre IQ a jiná skóre schopnosti jsou přibližně normálně distribuovaní. Pro většinu IQ test, zlý je 100 a směrodatná odchylka je 15.
- Viz též multivariate normální distribuce.
Vnější spojení a odkazy
- A. Kropinski je průvodce normální distribuce
- Stigler: Statistiky na stole, Harvard univerzitní tiskárna 1999, kapitola 22. Minulost termínu “normální distribuce”.
- Easylookup, software vyhledat hodnoty normální distribuce