Kvantil

Z Multimediaexpo.cz

Distribuční funkce s vyznačenými kvantily Q0,2, Q0,4, Q0,6, Q0,8

Kvantily (z lat. quantilis, jak malý/velký?) jsou ve statistice čísla (hodnoty), která dělí soubor seřazených (například naměřených) hodnot na několik zhruba stejně velkých částí. Kvantil je tedy míra polohy rozdělení pravděpodobnosti náhodné veličiny. Popisují body, ve kterých distribuční funkce náhodné proměnné prochází danou hodnotou.

Obsah

Definice

Kvantily tvoří vlastně inverzní funkci k funkci distribuční. V případě spojitého rozdělení s distribuční funkcí F(x) je kvantil Qp takové číslo, pro které platí

P(XQp) = p, tedy F(Qp) = p.

Pokud je distribuční funkce rostoucí (tedy i prostá), lze kvantil psát přímo jako inverzní funkci:

Qp = F−1(p).

Distribuční funkce však nemusí být prostá (byť je vždy neklesající), takže tuto definici nelze použít vždy. U diskrétních rozdělení pak ani vždy nemusí existovat bod, kde by distribuční funkce dosahovala přesně požadované hodnoty. Obecněji se proto kvantil Qp definuje jako takové číslo, pro které platí, že

P(XQp) ≥ p a zároveň P(X < Qp) ≤ p,

distribuční funkcí to lze vyjádřit jako

F(Qp+) = F(Qp) ≥ p a zároveň F(Qp−) ≤ p.

Ani tato obecná definice však přesně neurčuje kvantil v případě, že distribuční funkce není prostá. V takovém případě může jedné hodnotě p odpovídat několik čísel Qp, která tuto definici splňují. To se zpravidla nepovažuje za problém, někdy se definice doplňuje o způsob výběru jednoznačné hodnoty, např. největší (příp. nejmenší) z těchto čísel, jejich průměr apod., jedná se však jen o konvence bez nějakého hlubšího matematického významu.

Speciální označení kvantilů

Kvantily pro některé význačné hodnoty jsou označovány zvláštními jmény a pro nejdůležitější rozdělení jsou hodnoty základních kvantilů uváděny v tabulkách.

Medián

Kvantil rozdělující statistický soubor na dvě stejně početné množiny se nazývá medián, tzn. jedná se o kvantil \(Q_{0,5}\).

Kvartil

Tři kvartily rozdělují statistický soubor na čtvrtiny. 25 % prvků má hodnoty menší než dolní kvartil \(Q_{0,25}\) a 75 % prvků hodnoty menší než horní kvartil \(Q_{0,75}\); někdy se označují \(Q_1\) a \(Q_3\).

Kvintil

Čtyři kvintily dělí statistický soubor na pět stejných dílů. 20 % prvků souboru má hodnoty menší (nebo rovné) hodnotě prvního kvintilu, 80 % hodnoty větší (nebo rovné).

Decil

Decil dělí statistický soubor na desetiny. Jako \(k\)tý decil označujeme \(Q_{k/10}\).

Percentil

Percentil dělí statistický soubor na setiny. Jako \(k\)-tý percentil označujeme \(Q_{k/100}\).

Charakteristky variability

Hodnoty kvantilů představují charakteristiky polohy. Znalosti kvantilů lze však použít i k určení charakteristiky variability.

Mezikvartilové rozpětí

Pomocí horního a dolního kvartilu lze zavést mezikvartilové rozpětí, které definujeme jako hodnotu \(Q_{0,75}-Q_{0,25}\).

Mezidecilové rozpětí

Pomocí decilů lze zavést mezidecilové rozpětí, které je definováno jako \(Q_{0,9}-Q_{0,1}\).

Mezipercentilové rozpětí

Pomocí percentilů lze zavést mezipercentilové rozpětí, které je definováno jako \(Q_{0,99}-Q_{0,01}\).

Použití

Kvantily lze používat např. pro vyhodnocování přijímacích testů: bodové výsledky všech zájemců tvoří statistický soubor, zatímco příslušné kvantily označují, jaká část zájemců dosáhla daného výsledku. Pokud například kvantil 90 % má hodnotu 150 bodů a některý student v testu získal právě 150 bodů, ví, že má lepší hodnocení než 90 % všech studentů (je tedy mezi 10 % nejlepších a pokud má být přijato např. 15 % zájemců, měl by se kvalifikovat).

Příklad

U normálního rozdělení s nulovou střední hodnotou a jednotkovou směrodatnou odchylkou jsou některé kvantily:

Kvantily standardního normálního rozdělení
p 0,5 0,9 0,95 0,975 0,99 0,995
Qp 0,0 1,2816 1,6449 1,9600 2,3263 2,5758

Zde je například vidět, že necelý trojnásobek směrodatné odchylky u tohoto rozdělení pokrývá 99 % hodnot.

Související články