Sumární statistika

Krabicový diagram (boxplot) Michelsonova–Morleyova experimentu ukazující několik sumárních statistik.

Sumární nebo souhrnné statistiky, příp. charakteristiky se používají v popisné statistice pro shrnutí souboru pozorování, aby bylo možné jednoduše prezentovat co největší množství informací. Statistici obvykle popisují pozorování pomocí

Často používanou sadou pořadových statistik používaných jako sumární statistiky jsou pětičíselná charakteristika souboru, někdy rozšířená na sedmičíselnou charakteristiku souboru a příslušné krabicové diagramy (boxplots).

Za sumární statistiku můžeme považovat také položky v tabulce analýzy rozptylu.[1]

Příklady sumárních statistik

Míry polohy

Běžnými charakteristikami polohy nebo centrální tendence jsou aritmetický průměr, medián, modus, a mezikvartilový průměr.[2][3]

Variabilita

Běžnými charakteristikami variability jsou směrodatná odchylka, rozptyl, variační rozpětí, mezikvartilové rozpětí, absolutní odchylka, střední absolutní rozdíl a vzdálenostní standardní odchylka. Tyto charakteristiky měří absolutní variability. K rrelativním charakteristikám variability, které vztahují variabilitu k úrovni datových hodnot, patří variační koeficient.

Giniho koeficient původně vyvinutý pro měření nerovnosti příjmů je ekvivalentní s jedním z L-momentů.

Pro jednoduché shrnutí datového souboru se používají určité pořadové statistiky jako aproximace vybraných percentilů rozdělení.

Tvar rozdělení náhodné veličiny

Nejpoužívanějšími charakteristikami tvaru rozdělení náhodné veličiny jsou koeficient šikmosti a koeficient špičatosti; jejich alternativy bývají založeny na L-momentech. Další charakteristikou je vzdálenostní šikmost, jejíž nulová hodnota naznačuje centrální symetrii.

Závislost

Běžnou charakteristikou závislosti mezi dvěma náhodnými veličinami je Pearsonův korelační koeficient. Jako častá alternativa se používá Spearmanův koeficient pořadové korelace. Nezávislé náhodné veličiny mají nulovou hodnotu korelačního koeficientu. Nicméně nulová hodnota korelačního koeficientu neznamená nezávislost náhodných veličin korelace.

Lidské vnímání sumárních statistik

Lidé efektivně využívají sumární statistiky pro rychlé porozumění podstatě sluchových a vizuálních informací.[4][5][6]

Odkazy

Reference

V tomto článku byl použit překlad textu z článku Summary statistics na anglické Wikipedii.

  1. UPTON, G.; COOK, I. Oxford Dictionary of Statistics. [s.l.]: OUP, 2008. Dostupné online. ISBN 978-0-19-954145-4. 
  2. BULLEN, P. Handbook of Means and Their Inequalities. [s.l.]: Springer, 2003. 
  3. GRABISCH, M.; MARICHAL, J.L.; MESIAR, R.; PAP, E. Aggregation Functions. [s.l.]: Oxford University Press, 2009. 
  4. PIAZZA, Elise A.; SWEENY, Timothy D.; WESSEL, David; SILVER, Michael A.; WHITNEY, David, 2013. Humans Use Summary Statistics to Perceive Auditory Sequences. Psychological Science. Roč. 24, čís. 8, s. 1389–1397. DOI 10.1177/0956797612473759. PMID 23761928. 
  5. ALEXANDER, R. G.; SCHMIDT, J.; ZELINSKY, G. Z. Are summary statistics enough? Evidence for the importance of shape in guiding visual search.. Visual Cognition. 2014, roč. 22, čís. 3–4, s. 595–609. DOI 10.1080/13506285.2014.890989. PMID 26180505. 
  6. UTOCHKIN, Igor S., 2015. Ensemble summary statistics as a basis for rapid visual categorization. Journal of Vision. Roč. 15, čís. 4, s. 8. DOI 10.1167/15.4.8. PMID 26317396. 

Související články

Externí odkazy

Média použitá na této stránce

Michelsonmorley-boxplot.svg
Boxplot representing Michelson's data on the speed of light. It consists of five experiments, each made of 20 consecutive runs.