Úvodní stránka | Tato stránka v originále

Ředitel analýza komponent

V statistiky, ředitel analýza komponent (PCA) je technika zjednodušit datovou sadu; více formálně to je přeměnit použitý pro se snížit rozměrnost v datové sadě zatímco podrží si ty vlastnost datové sady to přispívat nejvíce k jeho rozdílnost. Tyto charakteristiky mohou být ' nejdůležitější ', ale toto není nutně případ, se spoléhat na aplikaci.

PCA je také volán Karhunen-Lo � ve přeměnit nebo Hotelling přeměnit. PCA má zvláštnost bytí optimální lineární přeměnit pro udržování subspace to má největší rozdílnost. Nicméně toto jde po ceně většího výpočetního požadavku, e. g. jestliže vyrovnal se jednotlivý cosine přeměnit. Unlike jiný lineární přemění, PCA nemá fixovaný soubor vektorů základu. Jeho vektory základu závisí na souboru dat.

Hlavní součást w1 datové sady x moci být definován jak (předpokládat nulu zlý, i. e. E (x) = 0)

(Vidět argument maximální pro zápis.) s prvními komponentami, - th komponenta může být najita tím, že odečte první hlavní součásti od x:
a substituting toto jako nová datová sada najít hlavní součást v:

Jednodušší způsob, jak vypočítat komponenty wi použití covariance matice x, vektor měření. Nálezem eigenvalues a eigenvectors covariance matice, my shledáme, že eigenvectors s největší eigenvalues odpovídat rozměrům, které mají nejsilnější korelace v datové sadě. Originální měření jsou konečně plánovaná na redukovaný vektorový prostor.

Příbuzný (nebo dokonce podobnější než příbuzný?) je počet empirický orthogonal funguje (EOF).

Další metoda redukce rozměru je self-organizovat mapu.

Jestliže PCA je používán v rozpoznávání vzorů často užitečná alternativa je lineární discriminant analýza, která vezme v úvahu oddělitelnost třídy, který není případ pro PCA.

Viz též: