Úvodní stránka | Tato stránka v originále

Zipf právo

Původně termín znamenal pozorování Harvard lingvisty George Kingsley Zipf to frekvence použití nth-nejvíce-často-použité slovo v nějakém přirozeném jazyce je nepřímo proporcionální k n.

Matematicky, to je nemožné jestliže tam je nekonečně mnoho slov v jazyce, protože (pouštění c > 0 naznačovat konstantu úměrnosti, která by dělala součet ze všech poměrné frekvence se rovnají k 1) my máme

Empirická studia našla to v angličtině, frekvence přibližně 1000 nejvíce-často-použitá slova jsou přibližně proporcionální k 1 /n1 + a epsilon; kde a epsilon; je jen mírně více než nula. Po o slově 1000th, frekvence klesají rychleji.

[Učený odkaz na podporu toto tvrzení o frekvencích slova by mělo být přidáno tady.]

Jak dlouho jako zastánce 1 + a epsilon; překročí 1, to je možné pro takový právo k držení s nekonečně mnoho slov, protože jestliže s > 1 pak

Hodnota tohoto součtu je a zeta; (s), kde a zeta; je Riemann zeta fungují.

Termín Zipf právo následně přišlo být používán se odkazovat na distribuce frekvence “dat pozice” ve kterém frekvence příbuzného nth-zařazená položka je dána Zeta distribucí, 1 / (nsa zeta; (s)), kde s > 1 parametr indexuje tuto rodinu rozdělení pravděpodobnosti. Opravdu, termín Zipf právo někdy prostě znamená zeta distribuci od té doby, co rozdělení pravděpodobnosti jsou někdy nazývána “právy”.

Více obecné právo navrhovalo Benoit Mandelbrot má frekvence

Toto je Zipf-Mandelbrot právo. “konstanta” inthis případ je podobný Hurwitz zeta fungují ocenil u s.

Zipf právo je experimentální právo, ne nějaký teoretický. Příčiny Zipfian distribucí v reálném životě jsou věc nějaké diskuse. Nicméně, Zipfian distribuce jsou obyčejně pozorovány v mnoha druhách jevů.

Zipf právo je často demonstrováno pomocí scatterplotting data, s osami být žurnál(zařadit objednávku) a nahrát (frekvenci). Jestliže body jsou blízké jediné přímce, distribuce drží se Zipf zákona.

Příklady sbírek přibližně dodržovat Zipf zákon:

To bylo špičaté ven (vidět vnější spojení dole) že Zipfian distribuce mohou také být považovány za jsoucí Pareto distribuce s výměnou proměnných.

Tabulka s obsahem
1 vidět také
2 dále číst
3 vnější spojení

Viz též

Další četba

Externí odkazy