Úvodní stránka | Tato stránka v originále

Minimální zprávová délka

Minimální zprávová délka je formální informační teorie restatement Occam holícího strojku: dokonce když modely nejsou se rovnat, jedno buzení nejkratší celková zpráva více pravděpodobně je správná.

Od Shannona' s Matematická teorie komunikace (1949) my známe to v optimálním kódu, zprávová délka události E, MsgLen (E), kde E má pravděpodobnost P (E), je dán MsgLen (E) = a bez; žurnál2(P(E)).

Od Bayesova teoréma my známe to pravděpodobnost hypotézy (H) podané svědectví (E) je úměrný k P (E | H) P (H), který je právě P (H a E). My chceme model s nejvyšší takovou pravděpodobností.

Proto, my chceme model, který tvoří nejkratší popis dat! Od MsgLen (H a E) = a bez; žurnál2(P (H a E )), nejpravděpodobnější model bude mít nejkratší takovou zprávu. Zpráva vnikne do dvou částí: a bez; žurnál2(P (H a E )) = a bez; žurnál2(P (H )) + a bez; žurnál2(P (E | H )). První je délka modelu a sekundy je délka dat, daný model.

Tak co? MML přirozeně a přesně vymění složitost modelu pro dobrotu záchvatu. Více komplikovaný model bere déle říci (delší první část) ale pravděpodobně sedí datům zlepšit (kratší druhou část). Tak MML metrický si nevybere komplikovaný model ledaže ten model platí za sebe.

Klíčové body o MML:

Viz též

Externí odkazy


Tento článek je špaček. Vy můžete pomáhat Wikipedia tím, že opraví to.