EBCDIC
EBCDIC (zkratka anglického Extended Binary Coded Decimal Interchange Code, Rozšířený binárně kódovaný desítkový výměnný kód) je 8bitový znakový kód, navržený firmou IBM na základě kódu používaného pro děrné štítky a příslušného 6bitového BCD kódu využívaného v periferiích IBM na přelomu 50. a 60. let. Mimo systémy firmy IBM (a systémy jiných firem navržené za účelem kompatibility se systémy IBM) se pro stejný účel používá obvykle spíše kód ASCII (resp. jeho následovníci jako Unicode), EBCDIC je všeobecně považováno za anachronismus.
Jeden znak v základním kódu EBCDIC zabírá jeden byte, z něhož se první 4 bity označují jako zóna a vyjadřují kategorii daného znaku, druhé 4 bity se označují jako číslice a určují konkrétní znak. V některých asijských zemích se používá rozšířená verze EBCDIC, která pro zobrazení čínských, japonských či korejských znaků používá 2bytový kód. Pro přechod ze standardního 1bytového do rozšířeného 2bytového režimu a zpět se používají kódy 0EH a 0FH.
Existuje mnoho variant kódu EBCDIC pro různé země. Tyto kódové stránky se označují číselným kódem známým jako CCSID (Coded Character Set IDentifier). Některé znaky existují v různých kódových stránkách na různých pozicích, na což je třeba dát pozor při přenosu dat mezi různými systémy podporujícími EBCDIC.
Jednou z výrazných nevýhod kódu EBCDIC je, že znaky latinky netvoří spojitou posloupnost, takže např. běžný regulární výraz [a-z]
používaný pro výběr všech malých písmen anglické abecedy by v EBCDIC nefungoval.
Rozložení
Kódy 0–63 a 255 jsou řídící, zbytek jsou platné znaky. Následující tabulka popisuje kódovou stránku 870 (tzv. Latin 2 Multilingual), zhruba odpovídající ASCII kódové stránce ISO-8859-2.
Dec | Hex | Znak | Unicode |
---|---|---|---|
0 | 00 | NULL | U+0000 |
1 | 01 | SOH | U+0001 |
2 | 02 | STX | U+0002 |
3 | 03 | ETX | U+0003 |
4 | 04 | PF | — |
5 | 05 | HT | U+0009 |
6 | 06 | LC | — |
7 | 07 | DEL | U+007F |
8 | 08 | GE | — |
9 | 09 | RLF | — |
10 | 0A | SMM | — |
11 | 0B | VT | U+000B |
12 | 0C | FF | U+000C |
13 | 0D | CR | U+000D |
14 | 0E | SO | U+000E |
15 | 0F | SI | U+000F |
16 | 10 | DLE | U+0010 |
17 | 11 | DC1 | U+0011 |
18 | 12 | DC2 | U+0012 |
19 | 13 | TM | — |
20 | 14 | RES | — |
21 | 15 | NL | — |
22 | 16 | BS | U+0008 |
23 | 17 | IL | — |
24 | 18 | CAN | U+0018 |
25 | 19 | EM | U+0019 |
26 | 1A | CC | — |
27 | 1B | CU1 | — |
28 | 1C | IFS | U+001C |
29 | 1D | IGS | U+001D |
30 | 1E | IRS | U+001E |
31 | 1F | IUS | U+001F |
32 | 20 | DS | — |
33 | 21 | SOS | — |
34 | 22 | FS | — |
35 | 23 | — | — |
36 | 24 | BYP | — |
37 | 25 | LF | U+000A |
38 | 26 | ETB | U+0017 |
39 | 27 | ESC | U+001B |
40 | 28 | — | — |
41 | 29 | — | — |
42 | 2A | SM | — |
43 | 2B | CU2 | — |
44 | 2C | — | — |
45 | 2D | ENQ | U+0005 |
46 | 2E | ACK | U+0006 |
47 | 2F | BEL | U+0007 |
48 | 30 | — | — |
49 | 31 | — | — |
50 | 32 | SYN | U+0016 |
51 | 33 | — | — |
52 | 34 | PN | — |
53 | 35 | RS | — |
54 | 36 | UC | — |
55 | 37 | EOT | U+0004 |
56 | 38 | — | — |
57 | 39 | — | — |
58 | 3A | — | — |
59 | 3B | CU3 | — |
60 | 3C | DC4 | U+0014 |
61 | 3D | NAK | U+0015 |
62 | 3E | — | — |
63 | 3F | SUB | U+001A |
Dec | Hex | Znak | Unicode |
---|---|---|---|
64 | 40 | mezera | U+0020 |
65 | 41 | pevná mezera | U+00A0 |
66 | 42 | â | U+00E2 |
67 | 43 | ä | U+00E4 |
68 | 44 | ţ | U+0163 |
69 | 45 | á | U+00E1 |
70 | 46 | ă | U+0103 |
71 | 47 | č | U+010D |
72 | 48 | ç | U+00E7 |
73 | 49 | ć | U+0107 |
74 | 4A | [ | U+005B |
75 | 4B | . | U+002E |
76 | 4C | < | U+003C |
77 | 4D | ( | U+0028 |
78 | 4E | + | U+002B |
79 | 4F | ! | U+0021 |
80 | 50 | & | U+0026 |
81 | 51 | é | U+00E9 |
82 | 52 | ę | U+0119 |
83 | 53 | ë | U+00EB |
84 | 54 | ů | U+016F |
85 | 55 | í | U+00ED |
86 | 56 | î | U+00EE |
87 | 57 | ľ | U+013E |
88 | 58 | ĺ | U+013A |
89 | 59 | ß | U+00DF |
90 | 5A | ] | U+005D |
91 | 5B | $ | U+0024 |
92 | 5C | * | U+002A |
93 | 5D | ) | U+0029 |
94 | 5E | ; | U+003B |
95 | 5F | ^ | U+005E |
96 | 60 | - | U+002D |
97 | 61 | / | U+002F |
98 | 62 | Â | U+00C2 |
99 | 63 | Ä | U+00C4 |
100 | 64 | ˝ | U+02DD |
101 | 65 | Á | U+00C1 |
102 | 66 | Ă | U+0102 |
103 | 67 | Č | U+010C |
104 | 68 | Ç | U+00C7 |
105 | 69 | Ć | U+0106 |
106 | 6A | U+007C | |
107 | 6B | , | U+002C |
108 | 6C | % | U+0025 |
109 | 6D | _ | U+005F |
110 | 6E | > | U+003E |
111 | 6F | ? | U+003F |
112 | 70 | ˇ | U+02C7 |
113 | 71 | É | U+00C9 |
114 | 72 | Ę | U+0118 |
115 | 73 | Ë | U+00CB |
116 | 74 | Ů | U+016E |
117 | 75 | Í | U+00CD |
118 | 76 | Î | U+00CE |
119 | 77 | Ľ | U+013D |
120 | 78 | Ĺ | U+0139 |
121 | 79 | ` | U+0060 |
122 | 7A | : | U+003A |
123 | 7B | # | U+0023 |
124 | 7C | @ | U+0040 |
125 | 7D | ' | U+0027 |
126 | 7E | = | U+003D |
127 | 7F | " | U+0022 |
Dec | Hex | Znak | Unicode |
---|---|---|---|
128 | 80 | ˘ | U+02D8 |
129 | 81 | a | U+0061 |
130 | 82 | b | U+0062 |
131 | 83 | c | U+0063 |
132 | 84 | d | U+0064 |
133 | 85 | e | U+0065 |
134 | 86 | f | U+0066 |
135 | 87 | g | U+0067 |
136 | 88 | h | U+0068 |
137 | 89 | i | U+0069 |
138 | 8A | ś | U+015B |
139 | 8B | ň | U+0148 |
140 | 8C | đ | U+0111 |
141 | 8D | ý | U+00FD |
142 | 8E | ř | U+0159 |
143 | 8F | ş | U+015F |
144 | 90 | ° | U+00B0 |
145 | 91 | j | U+006A |
146 | 92 | k | U+006B |
147 | 93 | l | U+006C |
148 | 94 | m | U+006D |
149 | 95 | n | U+006E |
150 | 96 | o | U+006F |
151 | 97 | p | U+0070 |
152 | 98 | q | U+0071 |
153 | 99 | r | U+0072 |
154 | 9A | ł | U+0142 |
155 | 9B | ń | U+0144 |
156 | 9C | š | U+0161 |
157 | 9D | ¸ | U+00B8 |
158 | 9E | ˛ | U+02DB |
159 | 9F | ¤ | U+00A4 |
160 | A0 | ą | U+0105 |
161 | A1 | ~ | U+007E |
162 | A2 | s | U+0073 |
163 | A3 | t | U+0074 |
164 | A4 | u | U+0075 |
165 | A5 | v | U+0076 |
166 | A6 | w | U+0077 |
167 | A7 | x | U+0078 |
168 | A8 | y | U+0079 |
169 | A9 | z | U+007A |
170 | AA | Ś | U+015A |
171 | AB | Ň | U+0147 |
172 | AC | Ð | U+00D0 |
173 | AD | Ý | U+00DD |
174 | AE | Ř | U+0158 |
175 | AF | Ş | U+015E |
176 | B0 | ˙ | U+02D9 |
177 | B1 | Ą | U+0104 |
178 | B2 | ż | U+017C |
179 | B3 | Ţ | U+0162 |
180 | B4 | Ż | U+017B |
181 | B5 | § | U+00A7 |
182 | B6 | ž | U+017E |
183 | B7 | ź | U+017A |
184 | B8 | Ž | U+017D |
185 | B9 | Ź | U+0179 |
186 | BA | Ł | U+0141 |
187 | BB | Ń | U+0143 |
188 | BC | Š | U+0160 |
189 | BD | ¨ | U+00A8 |
190 | BE | ´ | U+00B4 |
191 | BF | × | U+00D7 |
Dec | Hex | Znak | Unicode |
---|---|---|---|
192 | C0 | { | U+007B |
193 | C1 | A | U+0041 |
194 | C2 | B | U+0042 |
195 | C3 | C | U+0043 |
196 | C4 | D | U+0044 |
197 | C5 | E | U+0045 |
198 | C6 | F | U+0046 |
199 | C7 | G | U+0047 |
200 | C8 | H | U+0048 |
201 | C9 | I | U+0049 |
202 | CA | měkké dělítko | U+00AD |
203 | CB | ô | U+00F4 |
204 | CC | ö | U+00F6 |
205 | CD | ŕ | U+0155 |
206 | CE | ó | U+00F3 |
207 | CF | ő | U+0151 |
208 | D0 | } | U+007D |
209 | D1 | J | U+004A |
210 | D2 | K | U+004B |
211 | D3 | L | U+004C |
212 | D4 | M | U+004D |
213 | D5 | N | U+004E |
214 | D6 | O | U+004F |
215 | D7 | P | U+0050 |
216 | D8 | Q | U+0051 |
217 | D9 | R | U+0052 |
218 | DA | Ě | U+011A |
219 | DB | ű | U+0171 |
220 | DC | ü | U+00FC |
221 | DD | ť | U+0165 |
222 | DE | ú | U+00FA |
223 | DF | ě | U+011B |
224 | E0 | \ | U+005C |
225 | E1 | ÷ | U+00F7 |
226 | E2 | S | U+0053 |
227 | E3 | T | U+0054 |
228 | E4 | U | U+0055 |
229 | E5 | V | U+0056 |
230 | E6 | W | U+0057 |
231 | E7 | X | U+0058 |
232 | E8 | Y | U+0059 |
233 | E9 | Z | U+005A |
234 | EA | ď | U+010F |
235 | EB | Ô | U+00D4 |
236 | EC | Ö | U+00D6 |
237 | ED | Ŕ | U+0154 |
238 | EE | Ó | U+00D3 |
239 | EF | Ő | U+0150 |
240 | F0 | 0 | U+0030 |
241 | F1 | 1 | U+0031 |
242 | F2 | 2 | U+0032 |
243 | F3 | 3 | U+0033 |
244 | F4 | 4 | U+0034 |
245 | F5 | 5 | U+0035 |
246 | F6 | 6 | U+0036 |
247 | F7 | 7 | U+0037 |
248 | F8 | 8 | U+0038 |
249 | F9 | 9 | U+0039 |
250 | FA | Ď | U+010E |
251 | FB | Ű | U+0170 |
252 | FC | Ü | U+00DC |
253 | FD | Ť | U+0164 |
254 | FE | Ú | U+00DA |
255 | FF | EO | — |
Externí odkazy
- F.0 Appendix F. Code Pages Archivováno 21. 3. 2001 na Wayback Machine.