Unární kódování

Unární kódování je kódování, které zakóduje přirozené číslo n pomocí n po sobě následujících jedniček a jednou nulou (pokud je přirozené číslo chápáno jako nezáporné celé číslo) nebo jako n − 1 po sobě následujících jedniček následovaných jednou nulou (když přirozené číslo je chápáno jako kladné celé číslo). Například 5 je reprezentována 111110 nebo 11110. Některé varianty tohoto kódování prohazují 0 a 1. Nuly a jedničky můžeme považovat za zaměnitelné bez ztráty obecnosti. Unární kódování tvoří prefixový kód.

Příklady unárního kódování
n (nezáporné)n (kladné)Unární kódInverze
0101
121001
23110001
3411100001
451111000001
56111110000001
6711111100000001
781111111000000001
89111111110000000001
91011111111100000000001

Unární kódování je optimálním kódováním pro následující diskrétní pravděpodobnostní rozdělení

pro .

Kódujeme-li po symbolech, pak je unární kódování optimální pro každé geometrické rozdělení

pro každé k ≥ φ = 1.61803398879…, zlatý řez, nebo více obecně, pro každé diskrétní rozdělení pro které platí

pro .

Přestože je kódování optimální pro výše zmíněné pravděpodobnosti, Golombovo kódování dosahuje lepšího kompresního poměru pro geometrická rozdělení, protože nepovažuje vstupní symboly za nezávislé. Ze stejného důvodu funguje aritmetické kódování lépe pro obecná rozdělení pravděpodobnosti.

Modifikované unární kódování je použito v UTF-8. Unární kódování je také použito v kódováních, která používají schémata pro dělení kódových slov jako např. Golombovo kódování.

Reference

V tomto článku byl použit překlad textu z článku Unary coding na anglické Wikipedii.