Princip maximální entropie
princip maximální entropie je metoda pro analyzovat dostupný informace aby určoval jedinečný epistemic pravděpodobnost distribuce. Claude E. Shannonová, původce informační teorie, definoval míru nejistoty pro distribuci pravděpodobnosti (H(p) = - & Sigma pi žurnál pi) který on volal entropie informací. V jeho práci, entropie informací byla určována od (i. e. byla funkce) daná pravděpodobnostní distribuce. Princip maximální entropie řekne nám to hovořit je také možný: distribuce pravděpodobnosti může být určována používat informace pojetí entropie. To říká distribuce pravděpodobnosti, která jedinečně reprezentuje nebo kóduje náš stav informací je jeden to maximalizuje míru nejistoty H(p) zatímco zůstane odpovídající našim informacím.Přirozeně, toto pravidlo je bezvýznamné k těm kdo podporovat výklad frekvence pravděpodobnosti, pro koho pravděpodobnosti jsou poměrné frekvence poněkud než míry víry v nejisté problémy, podmíněný na stavu informací.
| Tabulka s obsahem |
| 1 Testable informace 2 generál řešení pro maximum distribuce entropie s lineárními omezeními 3 ospravedlnění pro princip maximální entropie 4 odkazy 5 externích spojení |
Princip maximální entropie je jen užitečný když všichni našich informací je třídy nazvaný testable informace. Údaj je testable jestliže my můžeme určovat zda nebo ne daná distribuce je slučitelná s tím. Pro příklad, sdělení
- " Očekávání proměnné x je 2.87 "
- "p2+p3 > 0. 9 "
Daný testable informace, maximum procedura entropie sestává z hledat distribuci pravděpodobnosti, která maximalizuje entropii informací, podřízený omezením informací. Tato omezená optimalizace problém je typicky řešil používání metoda Lagrangea multipliers.
Zvětšení entropie s ne testable informace se konají pod jediným omezením: suma pravděpodobností musí být jedna. Pod tímto omezením, maximální entropie distribuce pravděpodobnosti je jednotná distribuce,
Generál řešení pro maximum distribuce entropie s lineárními omezeními
My máme některé testable informace Já o kvantitě x & isin {x1, x2,..., xn}. My vyjádříme tyto informace jak m omezení očekávání funkcí fk, i. e. my vyžadujeme naše epistemic distribuce pravděpodobnosti uspokojit
& Lambdak parametry jsou Lagrange multipliers jehož zvláštní hodnoty jsou určeny omezeními shodnout se k
Pro spojité distribuce, (Jaynes, 1963, 1968, 2003) shledá, že omezená forma výrazu entropie jako distribuce se přiblíží nepřetržitá distribuce je
My máme některé testable informace Já o kvantitě x který přijme hodnoty někteří pauza reálná čísla (všichni integrals dole být u konce tato pauza). My vyjádříme tyto informace jak m omezení očekávání funkcí fk, i. e. my vyžadujeme naše epistemic funkce hustoty pravděpodobnosti uspokojit
Ospravedlnění pro princip maximální entropie
Podpůrcové principu maximální entropie ospravedlňují jeho používání v přiřazovat epistemic pravděpodobnosti v několik cestách, včetně následovat dva argumenty. Tyto argumenty vezmou použití epistemic pravděpodobnost jak daný, a tak mít žádný vliv jestliže pojetí epistemic pravděpodobnost je sám pod otázkou.
Entropie informací jako míra ' uninformativeness '
Zvážit to jednotlivý epistemic distribuce pravděpodobnosti mezi m vzájemně exkluzivní problémy. Nejpoučnější distribuce by nastala, když jeden z problémů byl znán být pravdivý. V tom případě, entropie informací by byla rovná nule. Nejméně poučná distribuce by nastala, když není tam žádný důvod favorizovat některého jeden z problémů přes jiní. V tom případě, jediná rozumná pravděpodobnostní distribuce by byla jednotná a pak entropie informací by byla stejná s jeho maximální možnou hodnotou, žurnál m. Entropie informací může proto být viděn jako numerická míra který popisuje jak uninformative zvláštní pravděpodobnostní distribuce je od nuly (úplně poučný) k žurnálu m (kompletně uninformative).
Tím, že rozhodne se používat distribuci s maximem entropie dovolila našimi informacemi, argument je, my si vybereme nejvíce uninformative distribuce možný. Si vybrat distribuce s nižší entropií by byla převzít informace my neposedneme; si vybrat jednoho s vyšší entropií by porušil omezení informací my dělat posednout. Tak maximum distribuce entropie je jediná rozumná distribuce.
Následující hádka je výsledek návrhu vyroben Grahamem Wallis k E. T. Jaynesi v roce 1962 (Jaynes, 2003). To je nezbytně stejný matematický argument použitý pro původ funkce rozdělení v statistická mechanika, ačkoli pojmový důraz je docela odlišný. To má výhodu bytí přísně combinatorial v přírodě, dělat žádný odkaz k entropii informací jako míra ' nejistota ', ' uninformativeness ', nebo některý jiný imprecisely definoval pojetí. Informace funkce entropie není považovaná priori, ale spíše je nalezený v běhu argumentu; a argument vede přirozeně k proceduře maximalizovat entropii informací, poněkud než zacházet s tím v nějaké jiné cestě.
Předpokládat jednotlivce přeje si dělat epistemic domácí cvičení pravděpodobnosti mezi m vzájemně exkluzivní problémy. Ona má některé testable informace, ale je nejistý jak chodit zahrnovat tyto informace v jejím stanovení pravděpodobnosti. Ona proto si představí následující náhodný experiment. Ona bude distribuovat N quanta epistemic pravděpodobnost (každá hodnota 1 /N) u náhodný mezi m možnosti. (jeden by mohl představovat si, že ona hodí N míče do m kbelíky zatímco blindfolded. Aby byl co nejvíce férový, každý hodit je být nezávislý na některém jiný, a každý kbelík má být stejná velikost.) jednou experiment je dělán, ona zkontroluje to jestliže domácí cvičení pravděpodobnosti tak trvalo je shodný s jejími informacemi. Jestliže ne, ona bude odmítat to a snažit se znovu. Jinak, její stanovení bude být
Nyní, aby se snížil ' graininess ' epistemic domácí cvičení pravděpodobnosti, to bude být nutné pro použití docela velké množství quanta epistemic pravděpodobnost. Poněkud než vlastně uskutečnit, a možná muset opakovat, poněkud dlouhý náhodný experiment, náš protagonista rozhodne se prostě vypočítat a použít nejpravděpodobnější výsledek. Pravděpodobnost nějakého zvláštního výsledku je multinomial distribuce,
Nejpravděpodobnější výsledek je jeden který maximalizuje multiplicity W. Poněkud než maximalizovat W přímo, náš protagonista mohl equivalently maximalizovat některého monotonic rostoucí funkce W. Ona rozhodne se maximalizovat
Jaynes, E. T., 1963, ` informační teorie a statistická mechanika ', ve statistické fyzice, K. Ford (ed.), Benjamin, New York, p. 181. Dostupný tady.
Jaynes, E. T., 1968, ` dřívější pravděpodobnosti ', IEEE Trans. na vědě systémů a kybernetice, SSC-4, 227. Dostupný tady.
Jaynes, E. T., 2003, ' teorie pravděpodobnosti: Logika vědy ', Cambridge univerzitní tiskárna, 2003.
- Jiný velmi užitečný, snadný-k-četl konzultace, která doplňuje tento článek je