The English encyclopedia Allmultimedia.org will be launched in two phases.
The final launch of the Allmultimedia.org will take place on February 27, 2026
(shortly after the 2026 Winter Olympics).

Analýza hlavních komponent

Z Multimediaexpo.cz

(Rozdíly mezi verzemi)
m (1 revizi)
(+ Aktualizace)
 
(Není zobrazena jedna mezilehlá verze.)
Řádka 1: Řádka 1:
-
{{Wikipedia-cs|Analýza hlavních komponent|700}}
+
'''Analýza hlavních komponent''' (''{{Cizojazyčně|en|Principal Component Analysis}}'', '''PCA''') je v [[teorie signálu|teorii signálu]] [[transformace]] sloužící k dekorelaci [[data|dat]]. Často se používá ke [[snížení dimenze]] dat s co nejmenší ztrátou [[informace]].<ref>{{Citace elektronického periodika
 +
| titul = Martin Sebera - FSpS MU - Vícerozměrné statistické metody
 +
| periodikum = www.fsps.muni.cz
 +
| url = https://www.fsps.muni.cz/~sebera/vicerozmerna_statistika/pca.html
 +
| datum přístupu = 2022-01-17
 +
| url archivu = https://web.archive.org/web/20220302060409/https://www.fsps.muni.cz/~sebera/vicerozmerna_statistika/pca.html
 +
| datum archivace = 2022-03-02
 +
}}</ref> PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako [[singulární rozklad]] (SVD; v [[Lineární algebra|lineární algebře]]).
 +
Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné [[souřadná soustava|souřadné soustavy]]:
 +
 +
<big>\(Y = X P\)</big>
 +
 +
kde ''X'' je centrovaná matice ''n'' ''x'' ''d'' se vstupními ''d''-rozměrnými daty v ''n'' řádcích, ''Y'' obdobná matice výstupních dat,
 +
''P'' je ''d'' ''x'' ''d'' matice [[vlastní vektor|vlastních vektorů]] [[kovariance|kovarianční matice]] <big>\(C_X\)</big> splňující vztah <big>\(C_X = P \Lambda P^T\)</big>, kde <big>\(\Lambda\)</big> je [[diagonální matice]] obsahující na diagonále vlastní&nbsp;čísla <big>\(C_X\)</big> a matice vlastních vektorů <big>\(P\)</big> je ortonormální, tj. <big>\(P^T P = I_d\)</big>, kde
 +
<big>\(I_d\)</big> je [[jednotková matice]] dimenze <big>\(d\)</big>.
 +
 +
Vlastní vektory (sloupce matice ''P'') tvoří onu novou souřadnou soustavu.
 +
Centrování matice ''X'' dosáhneme odečtením příslušného [[Výběrový průměr|výběrového průměru]] od každého sloupce.
 +
{{RIGHTTOC}}
 +
== Odvození ==
 +
Matice ''Y'' je zřejmě také centrovaná, tj. [[aritmetický průměr]] každého jejího sloupce je 0.<ref>{{Citace elektronického periodika |titul=Archivovaná kopie |url=https://k101.unob.cz/~neubauer/pdf/ekon_PCA.pdf |datum přístupu=2022-01-17 |url archivu=https://web.archive.org/web/20220118182931/https://k101.unob.cz/~neubauer/pdf/ekon_PCA.pdf |datum archivace=2022-01-18 }}</ref>
 +
 +
Spočítáme, jak musí vypadat kovarianční matice nových dat ''Y'':
 +
 +
<big>\(C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.\)</big>
 +
 +
Vzhledem k tomu, že matice <big>\(\Lambda\)</big> je diagonální,
 +
 +
<big>\(C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d  \\ \end{matrix}\right ), \)</big>
 +
 +
vidíme, že sloupce matice ''Y'' jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.
 +
 +
== Použití ==
 +
Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel <big>\(\lambda_i\)</big>, budeme
 +
dostávat složky v ''Y'' setříděné podle rozptylu. Pokud chceme snížit dimenzi dat,
 +
stačí z ''Y'' vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání
 +
komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud
 +
máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které
 +
tímto postupem zahodíme.
 +
 +
=== Rozpoznávání ===
 +
V [[rozpoznávání]] slouží PCA jako jedna z tzv. ''Feature Extraction metod'' ([[extrakce rysů]]).
 +
Používají ji například kriminalisté pro rozpoznávání obličejů.
 +
 +
=== Komprese ===
 +
Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké [[korelace]] mezi jednotlivými spektrálními kanály a převede
 +
obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.
 +
 +
== Související články ==
 +
* [[singulární rozklad]]<ref>{{Citace elektronického periodika
 +
| titul = dimensionality reduction - Relationship between SVD and PCA. How to use SVD to perform PCA?
 +
| periodikum = Cross Validated
 +
| url = https://stats.stackexchange.com/questions/134282/relationship-between-svd-and-pca-how-to-use-svd-to-perform-pca
 +
| datum přístupu = 2022-01-17
 +
}}</ref>
 +
* [[samoorganizující síť]]
 +
 +
== Reference ==
 +
<references />
 +
== Externí odkazy ==
 +
* http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf — jednoduché vysvětlení PCA spolu s matematickým základem
 +
* https://web.archive.org/web/20040809034742/http://robotics.eecs.berkeley.edu/~rvidal/cvpr03-gpca-final.pdf — vysvětlení pokročilejší zobecněné PCA
 +
* [https://web.archive.org/web/20070318013042/http://www.reindeergraphics.com/foveapro/pca.shtml Příklady využití analýzy hlavních komponent na zřetelnější zobrazení struktur u grafických souborů] (anglicky)
 +
 +
 +
{{Commonscat|Principal component analysis}}{{Článek z Wikipedie}}
[[Kategorie:Statistika]]
[[Kategorie:Statistika]]
[[Kategorie:Strojové učení]]
[[Kategorie:Strojové učení]]
[[Kategorie:Zpracování obrazu]]
[[Kategorie:Zpracování obrazu]]

Aktuální verze z 20. 4. 2025, 08:48

Analýza hlavních komponent (Principal Component Analysis, PCA) je v teorii signálu transformace sloužící k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace.[1] PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako singulární rozklad (SVD; v lineární algebře).

Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:

\(Y = X P\)

kde X je centrovaná matice n x d se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je d x d matice vlastních vektorů kovarianční matice \(C_X\) splňující vztah \(C_X = P \Lambda P^T\), kde \(\Lambda\) je diagonální matice obsahující na diagonále vlastní čísla \(C_X\) a matice vlastních vektorů \(P\) je ortonormální, tj. \(P^T P = I_d\), kde \(I_d\) je jednotková matice dimenze \(d\).

Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.

Obsah

Odvození

Matice Y je zřejmě také centrovaná, tj. aritmetický průměr každého jejího sloupce je 0.[2]

Spočítáme, jak musí vypadat kovarianční matice nových dat Y:

\(C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.\)

Vzhledem k tomu, že matice \(\Lambda\) je diagonální,

\(C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d \\ \end{matrix}\right ), \)

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.

Použití

Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel \(\lambda_i\), budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.

Rozpoznávání

V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod (extrakce rysů). Používají ji například kriminalisté pro rozpoznávání obličejů.

Komprese

Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.

Související články

Reference

  1. Martin Sebera - FSpS MU - Vícerozměrné statistické metody. www.fsps.muni.cz [online].  [cit. 2022-01-17]. Dostupné online.  
  2. Archivovaná kopie.  [cit. 2022-01-17]. Dostupné online.
     
  3. dimensionality reduction - Relationship between SVD and PCA. How to use SVD to perform PCA?. Cross Validated [online].  [cit. 2022-01-17]. Dostupné online.  

Externí odkazy


Commons nabízí fotografie, obrázky a videa k tématu
Analýza hlavních komponent