Benfordův zákon

Histogram znázorňující Benfordův zákon: jednotlivé sloupečky znamenají počáteční číslici 1 až 9 a zobrazují relativní četnost výskytu každé číslice

Benfordův zákon, někdy též Newcombův-Benfordův zákon, je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) začínají čísla mnohem častěji číslicí 1 než jinou číslicí. Alternativní formulace: první číslice čísla pravděpodobně bude malá.[1] Zhruba 30 % čísel začíná jedničkou. Čím vyšší počáteční číslice je, tím méně pravděpodobně se vyskytuje na začátku čísel (viz obrázek s histogramem relativní četnosti výskytu jednotlivých číslice).

Ve skupině čísel reprezentujících reálné hodnoty čehokoli je asi 30% pravděpodobnost, že první číslovkou bude jednička. Dále pak 17,6 % čísel bude začínat dvojkou, 12,5 % trojkou a jen 4,57 % devítkou. Nejde o žádný matematický trik, ale o skutečný přírodní zákon, jímž se řídí soubory jakýchkoli přirozených dat bez ohledu na jejich podstatu nebo fyzikální jednotky. Jedinou podmínkou je, že data musí být v minimálním rozsahu tří logaritmických intervalů (tj. v minimálním rozsahu tří desítkových řádů).[2]

Tuto skutečnost poprvé objevil a zveřejnil kanadsko-americký matematik a astronom Simon Newcombe v článku „Note on the Frequency of Use of the Different Digits in Natural Numbers“ publikovaném v American Journal of Mathematics (1881, č. 4, s. 39–40).[3] Upozornil na skutečnost, že logaritmické tabulky v technické knihovně mají mnohem více ohmatané první stránky, tzn. stránky s čísly počínajícími jedničkou, než stránky na konci, tzn. stránky s čísly začínajícími číslicí 9. Usoudil, že uživatelé logaritmických tabulek (vědci a studenti přírodovědných a společenských oborů) se při své práci častěji setkávají s čísly začínajícími číslicí 1 nebo 2 než s čísly začínajícími číslicí 8 nebo 9. Na první pohled se zdá přirozené předpokládat, že první platná číslice čísel, s nimiž se lidé setkávají, bude se stejnou pravděpodobností jednička, dvojka i devítka. S touto intuitivní představou je však Newcombovo tvrzení v rozporu.[4]

Newcombe neuvedl žádnou analýzu konkrétních souborů dat, pokusil se však o určité matematické zdůvodnění výsledku. Článek upadl v zapomnění – autorovu tvrzení nebyla věnována pozornost několik desetiletí.[5]

Tento z určitého hlediska přírodní jev znovu objevil v roce 1938 fyzik Frank Benford.[5] Svá zjištění publikoval v článku „The Law of Anomalous Numbers“ v Proceedings Of The American Philosophical Society (1938, vol. 78, no. 4, s. 551–572).[6] Na rozdíl od Newcomba založil svá tvrzení na empirických pozorováních. Několik let shromažďoval číselné údaje z různých zdrojů a oborů (např. plochy povodí 335 řek, měrné skupenské teplo 1389 chemických sloučenin, čísla vyskytující se na titulní stránce novin a další). Dohromady zpracoval více než 20 000 číselných údajů ve 20 různých souborech dat a ukázal, že první číslice se opravdu nevyskytují všechny stejně často. I proto se pro zmíněnou zákonitost užívá pojmenování Benfordův zákon.[7][5]

Simon Newcomb i Frank Benford dospěli každý jinou cestou k vyjádření téhož.[7]

Matematický zápis

Počáteční číslice n () čísla v soustavě o základu b () se objevuje s pravděpodobností . V desítkové soustavě () dodržují počáteční číslice podle Benfordova zákona následující rozložení:

130,1 %
217,6 %
312,5 %
49,7 %
57,9 %
66,7 %
75,8 %
85,1 %
94,6 %

Reálné příklady

První příklad: pokud prozkoumáme seznam 58 nejvyšších staveb na světě, potom jednička je zdaleka nejčetnější vedoucí číslice, dokonce bez ohledu na to, zda výšku těchto staveb vyjádříme v metrech nebo ve stopách – i když při vyjádření výšky staveb v metrech je relativní četnost jedničky výrazně vyšší než při vyjádření ve stopách (vit Tabulka 1).

Druhý příklad (zobrazený v grafu vpravo od tabulky 1) ukazuje aplikaci Benfordova zákona na čísla, která vyjadřují velikost populace jednotlivých zemí (použita jsou data pro 237 zemí z června 2010). Červené sloupce zobrazují relativní četnost (v procentech) pro jednotlivé číslice. Černé tečky (nad nebo uvnitř každého sloupce) ukazují, jaká by měla být výška sloupce, pokud by relativní četnosti byly přesně podle Benfordova zákona.

Četnost první čísle (v %, červené sloupce) pro seznam 237 zemí podle velikosti populace (2010). Černé tečky u jednotlivých sloupců ukazují, jaká by měla být výška sloupce, pokud by relativní četnosti byly přesně podle Benfordova zákona
Tab. 1: Aplikace na 58 nejvyšších staveb světa
První
číslice
metrystopyDle Benfordova
zákona
PočetPodíl v %PočetPodíl v %
12441,4 %1627,6 %30,1 %
2915,5 %813,8 %17,6 %
3712,1 %58,6 %12,5 %
4610,3 %712,1 %9,7 %
511,7 %1017,2 %7,9 %
658,6 %46,9 %6,7 %
711,7 %23,4 %5,8 %
846,9 %58,6 %5,1 %
911,7 %11,7 %4,6 %

Třetí příklad ukazkuje četnost první číslice pro mocniny čísla dvě (2n). Pokud vezmeme sekvenci prvních číslic pro mocniny prvních 96 čísel (1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, ... , což je celočíselná Posloupnost A008952 v databázi On-Line Encyclopedia of Integer Sequences, relativní četnosti první číslice se opět výrazně blíží k hodnotám podle Benfordova zákona. Mnohem více, než bychom očekávali pro náhodnou posloupnost stejné délky, protože tato posloupnost prvních číslice je odvozena od geometrické posloupnosti druhých mocnin čísla dva.[8]

Tab. 2: Aplikace na mocniny čísla dva
První
číslice
ČetnostDle Benfordova
zákona
Početv %
12930,2 %30,1 %
21717,7 %17,6 %
31212,5 %12,5 %
41010,4 %9,7 %
577,3 %7,9 %
666,3 %6,7 %
755,2 %5,8 %
855,2 %5,1 %
955,2 %4,6 %

Aplikace

Benfordův zákon lze aplikovat při jednoduchém testování regulérnosti voleb, odhalování účetních podvodů (vč. národních účtů), při analýze zaokrouhlovacích chyb při rozsáhlých numerických výpočtech, jako doplňkový test k dalším metodám zkoumání kvality makroekonomických dat aj.

Konkrétně u voleb není Benfordův zákon sám o sobě důkazem podvodu, ale vodítkem nebo indikací k tomu, že k němu mohlo dojít, přičemž někdy mohou být „anomálie“ vysvětleny. U statistických dat je potřeba, aby se vstupní údaje lišily o několik řádů k tomu, aby se chovaly podle Benfordova zákona. Konkrétně k aplikaci tohoto zákona jako pomůcky pro zjišťování volebních podvodů existuje vědecká práce z univerzity v Cambridge z roku 2011,[9] která mimo jiné říká: „Pokud dojde k vyrovnanému soupeření dvou kandidátů ve volebních okrscích s počtem voličů řádově mezi 100 až 1000 na okrsek, pak první číslice počtu hlasů u každého kandidáta nebudou 1 nebo 2, ale spíše 4, 5 nebo 6.“

Zajímavosti

  • Zřejmě první významnější zmínkou o Benfordově zákoně v češtině je krátký článek Pavla Kantorka (profesora fyziky a karikaturisty) z roku 1998 v časopise Vesmír.[5][2]
  • Benfordův zákon byl několik desetiletí po svém objevu považován za pouhou zvláštnost, nikoli za matematický fakt.[10]

Odkazy

Reference

V tomto článku byl použit překlad textu z článku Benford's law na anglické Wikipedii.

  1. Arno Berger and Theodore P. Hill, Benford's Law Strikes Back: No Simple Explanation in Sight for Mathematical Gem, 2011.
  2. a b KANTOREK, Pavel. Benfordův zákon. Vesmír. 1998, roč. 77, č. 10, s. 583. Dostupné také z: http://www.vesmir.cz/clanky/clanek/id/1890
  3. NEWCOMBE, Simon. Note on the Frequency of Use of the Different Digits in Natural Numbers. American Journal of Mathematics 1881, č. 4, s. 39–40. Dostupné také z: https://archive.org/details/jstor-2369148/page/n1
  4. DVOŘÁK, Jiří. Benfordovo rozdělení. Praha, 2008, s. 6. Bakalářská práce. Ved. práce doc. Mgr. Zdeněk Hlávka, Ph.D. MFF UK, KPMS. Přístup také z: https://is.cuni.cz/webapps/zzp/detail/47310/
  5. a b c d SEIBERT, Jaroslav a ZAHRÁDKA, Jaromír. O čem pojednává Benfordův zákon. Matematika – fyzika – informatika. 2016, vol. 25, iss. 2, s. 91. ISSN 1210-1761. Přístupné také z: https://dk.upce.cz/handle/10195/67473
  6. BENFORD, Frank. The Law of Anomalous Numbers. Proceedinggs Of The American Philosophical Society. 1938, vol. 78, no. 4, s. 551–572. Dostupné také z: https://archive.org/details/in.ernet.dli.2015.529837/page/n599?q=%22The+Law+of+Anomalous+Numbers%22
  7. a b DVOŘÁK, Jiří. Benfordovo rozdělení. Praha, 2008, s. 8. Bakalářská práce. Ved. práce doc. Mgr. Zdeněk Hlávka, Ph.D. MFF UK, KPMS. Přístup také z: https://is.cuni.cz/webapps/zzp/detail/47310/
  8. RAIMI, Ralph A. The First Digit Problem. American Mathematical Monthly. 1976, s. 521–538. DOI 10.2307/2319349. JSTOR 2319349. (anglicky) 
  9. Benford's Law and the Detection of Election Fraud
  10. [HOUSER, Pavel]. Taje Benfordova zákona. In: Sciencemag.cz [online] 6. 12. 2016 [cit. 28. 7. 2019]. Dostupné z: https://sciencemag.cz/taje-benfordova-zakona/

Literatura

  • BELLOS, Alex. Alex za zrcadlem: jak se čísla odrážejí v životě a život v číslech. Překlad Ondrej Majer. Praha: Dokořán, 2016. 286 s. ISBN 978-80-7363-774-3.
  • BERGER, A.; HILL, T. P. and E. ROGERS. Benford Online Bibliography. May 1, 2015 [cit. 27. 7. 2019]. Dostupné z: http://www.benfordonline.net/
  • DVOŘÁK, Jiří. Benfordovo rozdělení. Praha, 2008. 52 s. Bakalářská práce. Ved. práce doc. Mgr. Zdeněk Hlávka, Ph.D., oponent RNDr. Michal Pešta, Ph.D. Matematicko-fyzikální fakulta UK, Katedra pravděpodobnosti a matematické statistiky. Přístup také z: https://is.cuni.cz/webapps/zzp/detail/47310/
  • HANZAL, Petr a FALTOVÁ LEITMANOVÁ, Ivana. Ověření platnosti Benfordova modelu v oboru účetních dat podnikatelských subjektů v České republice. Acta Universitatis Bohemiae Mendionales. 2010, č. 4, s. 39–45. ISSN 1212-3285.
  • HANZAL, Petr; CHLÁDEK, Petr a BISKUP, Roman. ARS-Auditing Revision Systém v nadnárodních ERP systémech. Systémová integrace. 2012, č. 4, s. 70–79.
  • [HOUSER, Pavel]. Taje Benfordova zákona. In: Sciencemag.cz [online] 6. 12. 2016 [cit. 28. 7. 2019]. Dostupné z: https://sciencemag.cz/taje-benfordova-zakona/
  • KANTOREK, Pavel. Benfordův zákon. Vesmír. 1998, roč. 77, č. 10, s. 583. Dostupné také z: http://www.vesmir.cz/clanky/clanek/id/1890
  • PLAČEK, Michal. Benfordův zákon: fakta a mýty. In: Bulletin komory certifikovaných účetních. 2013, č. 1. Praha: Komora certifikovaných účetních, 2013, s. 43–46. ISSN 2336-3576.
  • PLAČEK, Michal. Benfordův zákon, fakta a mýty. In: Nové trendy 2012. Sborník ze 7. mezinárodní vědecké konference. Znojmo: Soukromá vysoká škola ekonomická Znojmo, 2012, s. 193–199. ISBN 978-80-87314-29-6.
  • ROSS, Kenneth A. Benford’s law, a growth industry. The American Mathematical Monthly. 2011, vol. 118, no. 8, s. 571–583. ISSN 0002-9890.
  • SEIBERT, Jaroslav a ZAHRÁDKA, Jaromír. O čem pojednává Benfordův zákon. Matematika – fyzika – informatika. 2016, vol. 25, iss. 2, s. 89–98. ISSN 1210-1761. Přístupné z: https://dk.upce.cz/handle/10195/67473
  • SEIBERT, Jaroslav a ZAHRÁDKA, Jaromír. Zákon první číslice a jeho aplikace. Scientific papers of the University of Pardubice. Series D, Faculty of Economics and Administration = Sborník vědeckých prací Univerzity Pardubice. Serie D, Fakulta ekonomicko-správní. 2014, roč. 30, č. 1, s. 75–83. ISSN 1211-555X. Přístupné z: https://dk.upce.cz/handle/10195/54637

Externí odkazy

Média použitá na této stránce

Rozklad benforda.svg
Benford's distribution
Benfords law illustrated by world's countries population.svg
Autor: Melikamp, Licence: CC BY-SA 4.0
illustration of Benford's law, using the population of the countries of the world.

The chart depicts the percentage of countries having the corresponding digit as first digit of their population (red bars). For example, 64 countries of 237 (=27%) have 1 as leading digit of the population. Black points indicate what is predicted by Benford's law.

the data is from CIA Worldbook https://www.cia.gov/library/publications/the-world-factbook/rankorder/2119rank.html, accessed August 07, 2010

R Source:

beside = barplot(c(64,43,24,31,15,20,17,11,12)/2.37, names.arg=1:9, ylim=c(0,32), space=NULL, col="pink") ; points(beside, 100*(log(2:10, 10) - log(1:9, 10)), pch=19)