Simpsonův paradox

Simpsonův paradox pro kontinuální data: Pozitivní trend pro obě oddělené skupiny dat (modrá a červená), negativní trend (černá čárkovaná) pro kombinovanou množinu dat

Simpsonův paradox je statistický paradox při porovnání úspěšností dvou individuí (skupin) během více období, přičemž v jednotlivých obdobích je úspěšnější skupina A, ale celkově je úspěšnější skupina B. Paradox je pojmenovaný podle Edwarda Simpsona, který jej publikoval v roce 1951.[1] Protože jde o matematickou trivialitu, je prakticky jisté, že tento paradox byl pozorovaný možná staletí před ním, ale kvůli nepředstavitelné trivialitě ho nikdo nepublikoval.

Lidé jsou často zmateni, když se poprvé setkají s tímto paradoxem, což je způsobeno z interpretačního hlediska nevhodným příkladem.

Příklad paradoxu

1. semestr2. semestrsoučet
Student A2/825%2/2100%4/1040%
Student B1/520%4/580%5/1050%

Je zřejmé, že student A byl úspěšnější v obou semestrech, avšak celkově byl úspěšnější student B, přičemž celkový počet zkoušek byl pro oba stejný.

Podstata paradoxu

Podstata paradoxu spočívá v tom, že B měl poměrně vysokou úspěšnost během 5 zkoušek, tedy dlouhodobě. Student A, který v tomto semestru měl sice úspěšnost 100 %, avšak aplikovanou pouze na dvě zkoušky.

Jelikož nepředpokládáme rozdílnost nároků v první a druhém semestru, byl opravdu lepším studentem B. Právě uvedený příklad je však velmi zavádějící, je totiž statisticky velmi nepravděpodobné, že mohou existovat takové rozdíly mezi semestry. Pravděpodobně to muselo být něčím způsobené, např. změnou zkoušejícího. V tomto případě je třeba jednoznačně za lepšího studenta označit A, neboť byl úspěšnější u obou profesorů, jen měl smůlu, že většinu zkoušek měl u toho přísnějšího.

Skutečný příklad z praxe

Jako skutečný a dobrý příklad na ukázku správné a jednoduché interpretace je možné uvést porovnání úspěšnosti léčby ledvinových kamenů klasickou chirurgickou cestou a perkutánní nefrolitotomií.[2] Při hodnocení úspěšnosti bez ohledu na velikost kamene vychází perkutánní nefrolitotomie jako úspěšnější. Tento závěr je však mylný, neboť při hodnocení zvlášť malých a velkých kamenů vychází úspěšnější klasická (chirurgická) léčba.

Příčina paradoxu je v tom, že perkutánní nefrolitotomie se používala hlavně pro malé kameny a pravděpodobnost úspěšnosti léčby je víc ovlivněná velikostí kamene než použitou metodou léčby.

malé kamenyvelké kamenysoučet
Klasické operační postupy81/8793%192/26373%273/35078%
Perkutánní nefrolitotomie234/27087%55/8069%289/35083%

Za velké se v této práci považovaly kameny větší než 2 cm. Jako kritérium úspěšnosti bylo použité nepozorování výskytu kamenů po třech měsících od léčby, resp. redukce velikosti kamene na maximální velikost 2 mm.

Reference

V tomto článku byl použit překlad textu z článku Simpsonov paradox na slovenské Wikipedii.

  1. Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241
  2. C. R. Charig, D. R. Webb, S. R. Payne, O. E. Wickham (March 1986). "Comparison of treatment of renal calculi by operative surgery, percutaneous nephrolithotomy, and extracorporeal shock wave lithotripsy". British Medical Journal vol. 292 (1986), str. 879–882

Externí odkazy

Média použitá na této stránce

Simpson's paradox continuous.svg
Illustration of the quantitative version of en:Simpson's paradox: a positive trend appears for two separate groups (blue and red), whereas a negative trend (black, dashed) appears when the groups are combined.