CP932

CP932, Code Page 932, neboli Windows-31J je rozšíření kódování Shift-JIS vytvořené firmou Microsoft. Zahrnuje znakové sady JIS X 0201:1997, JIS X 0208:1997, speciální znaky NEC (řádek 13), NEC výběr rozšíření IBM (řádky 89-92) a rozšíření IBM (řádky 115-119). IANA používá pro toto kódování označení Windows-31J nebo csWindows31J, jeho MIB identifikátor je 2024.[1]

Tabulka kódování

CP932 používá jedno- a dvoubytové kódy. Kódům 0-127 a 160-223 jsou přiřazeny znaky s jednobytovými kódy, ostatní hodnoty jsou prvním bytem dvoubytových kódů. Celé kódování definuje celkem 7980 znaků. Dvoubytový znak s kódem 0x82D7 (první byte: 0x82, druhý byte: 0xD7) v CP932 odpovídá znaku U+3079 v Unicode (hiragana písmeno BE, べ).

CP932
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xŘídicí znaky
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~ŘZ
8xNZPrvní byte dvoubytového kódu
9x
AxNZ
Bxソ
Cx
Dx
ExPrvní byte dvoubytového kódu
FxNZNZNZNZ

ŘZ“ označuje řídicí znak, „NZ“ označuje kód ve standardu nedefinovaný.

Znak s kódem 0x5C je sice mapován na kódový bod U+005C v Unicode, ale obvykle je zobrazován jako znak yen.[1]

Mapování na Unicode

Následující tabulka ukazuje mapování jednobytových kódů 0x80–0xFF z CP932 na Unicode. Kompletní mapování včetně dvoubytových kódů (jejichž úvodní byte je v tabulce označen „DBCSLB“ – anglicky Double Byte Character Set Lead Byte) je na serveru Unicode.[2]

CP932
HexZnakUnicodeHexZnakUnicodeHexZnakUnicodeHexZnakUnicode
0x80NZ0xA0NZ0xC0U+FF800xE0DBCSLB
0x81DBCSLB0xA1U+FF610xC1U+FF810xE1DBCSLB
0x82DBCSLB0xA2U+FF620xC2U+FF820xE2DBCSLB
0x83DBCSLB0xA3U+FF630xC3U+FF830xE3DBCSLB
0x84DBCSLB0xA4U+FF640xC4U+FF840xE4DBCSLB
0x85DBCSLB0xA5U+FF650xC5U+FF850xE5DBCSLB
0x86DBCSLB0xA6U+FF660xC6U+FF860xE6DBCSLB
0x87DBCSLB0xA7U+FF670xC7U+FF870xE7DBCSLB
0x88DBCSLB0xA8U+FF680xC8U+FF880xE8DBCSLB
0x89DBCSLB0xA9U+FF690xC9U+FF890xE9DBCSLB
0x8ADBCSLB0xAAU+FF6A0xCAU+FF8A0xEADBCSLB
0x8BDBCSLB0xABU+FF6B0xCBU+FF8B0xEBDBCSLB
0x8CDBCSLB0xACU+FF6C0xCCU+FF8C0xECDBCSLB
0x8DDBCSLB0xADU+FF6D0xCDU+FF8D0xEDDBCSLB
0x8EDBCSLB0xAEU+FF6E0xCEU+FF8E0xEEDBCSLB
0x8FDBCSLB0xAFU+FF6F0xCFU+FF8F0xEFDBCSLB
0x90DBCSLB0xB0U+FF700xD0U+FF900xF0DBCSLB
0x91DBCSLB0xB1U+FF710xD1U+FF910xF1DBCSLB
0x92DBCSLB0xB2U+FF720xD2U+FF920xF2DBCSLB
0x93DBCSLB0xB3U+FF730xD3U+FF930xF3DBCSLB
0x94DBCSLB0xB4U+FF740xD4U+FF940xF4DBCSLB
0x95DBCSLB0xB5U+FF750xD5U+FF950xF5DBCSLB
0x96DBCSLB0xB6U+FF760xD6U+FF960xF6DBCSLB
0x97DBCSLB0xB7U+FF770xD7U+FF970xF7DBCSLB
0x98DBCSLB0xB8U+FF780xD8U+FF980xF8DBCSLB
0x99DBCSLB0xB9U+FF790xD9U+FF990xF9DBCSLB
0x9ADBCSLB0xBAU+FF7A0xDAU+FF9A0xFADBCSLB
0x9BDBCSLB0xBBU+FF7B0xDBU+FF9B0xFBDBCSLB
0x9CDBCSLB0xBCU+FF7C0xDCU+FF9C0xFCNZ
0x9DDBCSLB0xBDU+FF7D0xDDU+FF9D0xFDNZ
0x9EDBCSLB0xBEU+FF7E0xDEU+FF9E0xFENZ
0x9FDBCSLB0xBFソU+FF7F0xDFU+FF9F0xFFNZ

Odkazy

Reference

V tomto článku byl použit překlad textu z článku CP932 na polské Wikipedii.

  1. a b Microsoft Corporation. Update to windows-31J charset registration [online]. IANA [cit. 2017-04-26]. Dostupné online. 
  2. Shawn Steele (Microsoft). cp932 to Unicode table [online]. [cit. 2017-04-26]. Dostupné online. 

Související články

Externí odkazy