Rozdělení pravděpodobnosti
Rozdělení pravděpodobnosti (někdy také distribuce pravděpodobnosti) náhodné veličiny je pravidlo, kterým se každému jevu popisovanému touto veličinou přiřazuje určitá pravděpodobnost. Rozdělení pravděpodobnosti náhodné veličiny vznikne, pokud je každé hodnotě diskrétní náhodné veličiny nebo intervalu hodnot spojité náhodné veličiny přiřazena pravděpodobnost.
Rozdělení pravděpodobnosti lze také chápat jako zobrazení, které každému intervalu (nebo sjednocení intervalů) možných hodnot náhodné veličiny přiřazuje určité reálné číslo, které charakterizuje jeho pravděpodobnost.
Obecná formální definice
Nechť je pravděpodobnostní prostor, je Borelova σ-algebra, je měřitelný prostor a nechť je náhodná veličina. Pak rozdělení pravděpodobnosti náhodné veličiny je funkce definovaná vztahem .
Obvykle bude . Platí, že je pravděpodobnostní míra na , oproti tomu původní je míra na nějaké obecné σ-algebře . Pojem rozdělení pravděpodobnosti nám tedy umožňuje jednotným způsobem počítat kvantitativní charakteristiky různých náhodných veličin , aniž bychom museli zohledňovat původní prostor .
Tato definice zahrnuje diskrétní i spojitá rozdělení, ale je ve své obecnosti užitečná spíše jen v teorii. Pro praktické výpočty reprezentujeme pro zjednodušení kalkulací rozdělení pravděpodobnosti hustotou pravděpodobnosti resp. pravděpodobnostní funkcí, distribuční funkcí nebo kvantilovou funkcí, které v principu nesou stejnou informaci jako výše uvedená definice a jejich použití je více specializované.
Použití pojmu pravděpodobnostního rozdělení oproti pojmu náhodné veličiny vede ke ztrátě informace o možných jevech s nulovou pravděpodobností; tento teoretický problém je ale v praktických aplikacích typicky bezvýznamný.
Rozdělení pravděpodobnosti diskrétní náhodné veličiny
Pravděpodobnost, že diskrétní náhodná veličina bude mít po provedení náhodného pokusu hodnotu , značíme , nebo stručně .
Výsledkem jednoho náhodného pokusu je to, že náhodná veličina bude mít právě jednu hodnotu. Všechny hodnoty definičního oboru náhodné veličiny tedy představují úplný systém neslučitelných jevů, což znamená, že součet pravděpodobností všech možných hodnot diskrétní náhodné proměnné je roven 1, tzn.
Pravděpodobnostní funkce
Rozdělení pravděpodobnosti diskrétní náhodné veličiny se tedy vyjádří tak, že se určí pravděpodobnost pro všechna definičního oboru veličiny . Pravděpodobnosti jednotlivých hodnot jsou tedy vyjádřeny funkcí , která se nazývá pravděpodobnostní funkce.
Hodnoty pravděpodobností funkce vyjadřujeme obvykle tabulkou, např.
x | P(x) |
… | … |
Také se používá vyjádření ve formě grafu (viz obrázek). V některých případech lze také použít vyjádření pomocí matematického vzorce.
Znalost pravděpodobnostní funkce lze použít k výpočtu pravděpodobnosti. Například pravděpodobnost, že náhodná veličina leží mezi hodnotami a , se určí jako
Distribuční funkce diskrétní veličiny
Pomocí pravděpodobnostní funkce lze zavést distribuční funkci vztahem
Distribuční funkce je neklesající a je spojitá zprava. Hodnoty distribuční funkce leží v rozsahu . Pro diskrétní náhodnou veličinu lze pro libovolné reálné číslo vyjádřit distribuční funkci vztahem
Vlastnosti
Jestliže hodnoty náhodné veličiny leží v intervalu , pak a .
Distribuční funkci lze, podobně jako pravděpodobnostní funkci, použít k výpočtu pravděpodobnosti, neboť
Důležitá diskrétní rozdělení
- Alternativní rozdělení (X nabývá pouze dvou hodnot 0 nebo 1)
- Binomické rozdělení (n pokusů se stejnou pravděpodobností)
- Poissonovo rozdělení
- Negativně binomické rozdělení
- Pascalovo rozdělení (speciální případ negativně binomického rozdělení)
- Geometrické rozdělení (speciální případ Pascalova rozdělení)
- Hypergeometrické rozdělení
- Logaritmické rozdělení
Rozdělení pravděpodobnosti spojité náhodné veličiny
Spojitá náhodná veličina má spojitou distribuční funkci . Rozdělení spojité náhodné veličiny nelze popsat pravděpodobnostní funkcí v určitém bodě.
Hustota pravděpodobnosti
Hustota pravděpodobnosti je funkce, jejíž hodnotu pro libovolný zvolený prvek z množiny možných vzorků (hodnot náhodné proměnné) lze interpretovat jako relativní četnost hodnoty tohoto prvku v rámci celé množiny možných vzorků daného času.
Rozdělení pravděpodobnosti spojité náhodné veličiny se určuje prostřednictvím funkce, která se nazývá hustota rozdělení pravděpodobnosti (hustota pravděpodobnosti, anglicky Probability Density Function, PDF). Pro spojitou náhodnou veličinu obecně neplatí, že také hustota pravděpodobnosti je spojitá.
Je-li hustota pravděpodobnosti spojité náhodné veličiny , pak platí
- ,
kde je definiční obor veličiny . Pro hodnoty mimo definiční obor je hustota pravděpodobnosti nulová, takže pro .
Ze znalosti hustoty pravděpodobnosti je možné určit pravděpodobnost, že náhodná veličina nabývá hodnotu z intervalu , tedy
Pravděpodobnost, že spojitá náhodná veličina nabývá určité (přesně dané) hodnoty, je nulová, což plyne z předchozího vztahu. Důsledkem toho je, že pro spojitou náhodnou veličinu platí vztahy
Distribuční funkce spojité veličiny
Distribuční funkce jednorozměrné reálné náhodné veličiny se definuje jako pravděpodobnost, že realizace této náhodné veličiny nepřekročí :
Distribuční funkce je neklesající, zprava spojitá, její limita je nula, v pak jedna.
Komplementární distribuční funkce se pak definuje jako .
Pro spojitou náhodnou veličinu s hustotou pravděpodobnosti se distribuční funkce dá spočítat také podle vztahu
Vlastnosti
Platí, že a .
Distribuční funkci lze použít k výpočtu pravděpodobnosti, neboť
Lze dokázat, že mezi hustotou pravděpodobnosti a distribuční funkcí platí vztah
- ,
pokud derivace distribuční funkce v daném bodě existuje.
Důležitá spojitá rozdělení
- Rovnoměrné rozdělení
- Normální rozdělení (označované také jako Gaussovo rozdělení)
- Logaritmicko-normální rozdělení (také log-normální rozdělení)
- Exponenciální rozdělení
- Cauchyho rozdělení
- Gama rozdělení
- Laplaceovo rozdělení (nebo také dvojitě exponenciální rozdělení)
- Logistické rozdělení
- Maxwellovo–Boltzmannovo rozdělení
- Studentovo rozdělení
- Fisherovo–Snedecorovo rozdělení
- χ² rozdělení (Chí kvadrát)
- rozdělení beta
Vícerozměrné rozdělení pravděpodobnosti
Sdružená a marginální pravděpodobnost
Mějme -rozměrný náhodný vektor , jehož složkami jsou diskrétní náhodné veličiny . Jejich rozdělení lze popsat sdruženou (simultánní) pravděpodobností
Tento vztah udává pravděpodobnost, že náhodná veličina nabude hodnotu , náhodná veličina nabude hodnoty , atd. pro všechna a .
Pro sdružené pravděpodobnosti zobrazují v korelační tabulce
x | … | Součet | |||
… | |||||
… | |||||
… | … | … | … | … | … |
… | |||||
Součet | … | 1 |
Pravděpodobnosti a jsou marginální (okrajové) pravděpodobnosti. Platí tedy
Dále platí
Sdružená a marginální distribuční funkce
Sdruženou (simultánní) distribuční funkci lze pro -rozměrný náhodný vektor diskrétních veličin definovat jako
Sdružená distribuční funkce (pro dvě proměnné X, Y) splňuje podmínky
Podobné podmínky platí také pro vícerozměrné náhodné vektory.
Marginální (okrajové) distribuční funkce lze pro vektor dvou proměnných a zapsat vztahy
Podobně lze marginální distribuční funkce určit také v případě vícerozměrných náhodných vektorů.
Sdružená a marginální hustota pravděpodobnosti
Rozdělení dvou spojitých náhodných veličin je možné popsat sdruženou hustotou pravděpodobnosti . Sdružená hustota pravděpodobnosti musí splňovat podmínku
Marginální hustoty pravděpodobnosti se určí jako
Sdruženou distribuční funkci pak je
Ze sdružené distribuční funkce lze naopak získat sdruženou hustotu pravděpodobnosti
Podobně lze postupovat také v případě -rozměrných vektorů spojitých náhodných veličin. Sdruženou hustotu pravděpodobnosti je pak možné získat jako
Marginální pravděpodobnost lze definovat pro libovolnou skupinu veličin () daného -rozměrného náhodného vektoru. Rozdělení je závislé pouze na daných veličinách a na zbývajících veličinách nezávisí. Pro je nutno rozlišovat podvojnou nezávislost a nezávislost vzájemnou.
Jsou-li veličiny vzájemně nezávislé, pak platí
Podmíněné rozdělení pravděpodobnosti
Podmíněné rozdělení náhodné veličiny vzhledem k veličině je rozdělení veličiny za podmínky, že náhodná veličina nabyla hodnoty .
Podmíněné rozdělení je definováno jako podíl rozdělení sdruženého a marginálního.
Pro dvě diskrétní náhodné veličiny je možné podmíněnou pravděpodobnost veličiny vzhledem k zapsat jako
pro , kde je marginální pravděpodobnost a je pravděpodobnost sdružená.
Obdobně vznikne pro podmíněnou pravděpodobnost veličiny vzhledem k vztah
pro , kde je marginální pravděpodobnost a je opět sdružená pravděpodobnost.
Podmíněná distribuční funkce
Podmíněné distribuční funkce zapsat zapsat jako
Podmíněná hustota pravděpodobnosti
U dvourozměrného náhodného vektoru, jehož složkami jsou spojité náhodné veličiny a , lze podmíněné hustoty pravděpodobnosti vyjádřit jako
pro a
pro , kde je sdružená hustota pravděpodobnosti a a jsou marginální hustoty pravděpodobnosti.
Pro podmíněné distribuční funkce spojitých náhodných veličin pak platí
Charakteristiky rozdělení náhodné veličiny
Charakteristiky náhodné veličiny jsou vhodně vybrané číselné údaje, které shrnují základní informace o rozdělení pravděpodobnosti náhodné veličiny. Charakteristiky poskytují pouze základní a hrubou představu o náhodné veličině, neboť charakteristiky (obvykle) nepostačují k jednoznačnému popisu rozdělení pravděpodobnosti. Naproti tomu rozdělení pravděpodobnosti sice poskytuje jednoznačný popis náhodné veličiny, obvykle však není dostatečně přehledné.
Důležitými charakteristikami rozdělení jsou střední hodnota a rozptyl.
Literatura
- HAMPL, Martin. Realita, společnost a geografická organizace: hledání integrálního řádu. Praha : DemoArt, 1998. ISBN 80-902154-7-5
Související články
Externí odkazy
- Obrázky, zvuky či videa k tématu rozdělení pravděpodobnosti na Wikimedia Commons
Média použitá na této stránce
A selection of Normal Distribution Probability Density Functions (PDFs). Both the mean, μ, and variance, σ², are varied. The key is given on the graph.
Demonstrace diskretniho rozdeleni pravdepodobnosti (opravena verze, sum(P_x) by melo byt rovno 1)
A selection of Normal Distribution Cumulative Density Functions (CDFs). Both the mean, μ, and variance, σ², are varied. The key is given on the graph.