ISO8859 不是一个标准,而是一系列的标准,这套字符集与编码系统的共同特色是,以同样的码位对应不同字符集
中文名 | ISO8859 |
---|---|
属 性 | 一系列的标准 |
特 色 | 同样的码位对应不同字符集 |
限 制 | 定义至多 95 个字符 |
特 性 | 其码位都在 0xA1 – 0xFF |
要 求 | 不准许折行的空格 |
编码
其基本精神是:
1.与 ASCII 相容,所以所有的低位皆不使用。
2.高位中的前 32 个码位 (0x80 – 0x9F 或 128–159),保留给扩充定义的 32 个控制码,称为 C1 控制码 (0–31 称为 C0 控制码)。
3.高位中第 33 个码位 (0xA0 或 160),也就是对应 ASCII 中 SP (空格) 的码位,总是代表 Non-breakable space,也就是不准许折行的空格。
4.每个字符集定义至多 95 个字符,其码位都在 0xA1 – 0xFF 或 161–255。
5.每个字符集收录欧洲某地区的共同常用字符。
符集介绍
ISO8859-1 字符集,也就是 Latin-1,是西欧常用字符,包括德法两国的字母。
ISO8859-2 字符集,也称为 Latin-2,收集了东欧字符。
ISO8859-3 字符集,也称为 Latin-3,收集了南欧字符。
ISO8859-4 字符集,也称为 Latin-4,收集了北欧字符。
ISO8859-5 字符集,也称为 Cyrillic,收集了斯拉夫语系字符。
ISO8859-6 字符集,也称为 Arabic,收集了阿拉伯语系字符。
ISO8859-7 字符集,也称为 Greek,收集了希腊字符。
ISO8859-8 字符集,也称为 Hebrew,收集了西伯莱 (犹太人) 字符。
ISO8859-9 字符集,也称为 Latin-5 或 Turkish,收集了土耳其字符。
ISO8859-10 字符集,也称为 Latin-6 或 Nordic,收集了北欧 (主要指斯堪地那维亚半岛) 的字符。
ISO8859-11 字符集,也称为 Thai,它是从泰国的 TIS620 标准字符集演化而来。
ISO8859-12 字符集,目前尚未定义。
ISO8859-13 字符集,也称为 Latin-7,主要函盖波罗的海(Baltic) 诸国的文字符号,也补充一些在 Latin-6 中遗漏的拉脱维亚 (Latvian) 字符。
ISO8859-14 字符集,也称为 Latin-8,它将 Latin-1 中的某些符号换成塞尔特语 (Celtic) 的字符。塞尔特族是指英伦外围的威尔斯人 (Welsh) 和盖尔人 (Gaelic)。
ISO8859-15 字符集,也称为 Latin-9,或者被匿称为 Latin-0,它将 Latin-1 中较少用到的符号删除,换成当初遗漏的法文和芬兰字母;还有,把英镑和日元之间的金钱符号,换成了欧盟货币符号。
ISO 8859-16,正式编号为ISO/IEC 8859-16:2001,又称Latin-10,这个字符集设计来涵盖阿尔巴尼亚语、克罗地亚语、匈牙利语、意大利语、波兰语、罗马尼亚语及斯洛文尼亚语等东南欧国家语言。 `
控制码
以下是 C1 控制码的号码和名称。
HEX | DEC | 功能 |
---|---|---|
80 | 128 | PADDING CHARACTER |
81 | 129 | HIGH OCTET PRESET |
82 | 130 | BREAK PERMITTED HERE |
83 | 131 | NO BREAK HERE |
84 | 132 | INDEX |
85 | 133 | NEXT LINE |
86 | 134 | START OF SELECTED AREA |
87 | 135 | END OF SELECTED AREA |
88 | 136 | CHARACTER TABULATION SET |
89 | 137 | CHARACTER TABULATION WITH JUSTIFICATION |
8A | 138 | LINE TABULATION SET |
8B | 139 | PARTIAL LINE FORWARD |
8C | 140 | PARTIAL LINE BACKWARD |
8D | 141 | REVERSE LINE FEED |
8E | 142 | SINGLE-SHIFT TWO |
8F | 143 | SINGLE-SHIFT THREE |
90 | 144 | DEVICE CONTROL STRING |
91 | 145 | PRIVATE USE ONE |
92 | 146 | PRIVATE USE TWO |
93 | 147 | SET TRANSMIT STATE |
94 | 148 | CANCEL CHARACTER |
95 | 149 | MESSAGE WAITING |
96 | 150 | START OF GUARDED AREA |
97 | 151 | END OF GUARDED AREA |
98 | 152 | START OF STRING |
99 | 153 | SINGLE GRAPHIC CHARACTER INTRODUCER |
9A | 154 | SINGLE CHARACTER INTRODUCER |
9B | 155 | CONTROL SEQUENCE INTRODUCER |
9C | 156 | STRING TERMINATOR |
9D | 157 | OPERATING SYSTEM COMMAND |
9E | 158 | PRIVACY MESSAGE |
9F | 159 | APPLICATION PROGRAM COMMAND |
字符编码
十进制 | 十六进制 | 字符 | 说明 |
---|---|---|---|
160 | A0 | 无 | 间断空间 |
161 | A1 | ? | 倒置的叹号 |
162 | A2 | ¢ | 美分标志 |
163 | A3 | £ | 英镑标志 |
164 | A4 | € | 货币标志 |
165 | A5 | ¥ | 日元标志 |
166 | A6 | ? | BROKEN BAR |
167 | A7 | § | 节标志 |
168 | A8 | ? | 分音符号 |
169 | A9 | ? | 版权标志 |
170 | AA | a | 阴性顺序指示 |
171 | AB | ? | 左指向双角引号 |
172 | AC | ? | NOT SIGN |
173 | AD | 软 | 连字符 |
174 | AE | ? | 已注册标志 |
175 | AF | ˉ | 长音符号 |
176 | B0 | ° | 度标志 |
177 | B1 | ± | 正负标志 |
178 | B2 | 2 | 上角标2 |
179 | B3 | 3 | 上角标3 |
180 | B4 | ? | 高音重音符号 |
181 | B5 | μ | MICRO SIGN |
182 | B6 | ? | PILCROW SIGN |
183 | B7 | · | 中间点 |
184 | B8 | ? | 变音符号 |
185 | B9 | 1 | 上角标1 |
186 | BA | o | 阳性顺序指示 |
187 | BB | ? | 右指向双角引号 |
188 | BC | ? | 普通分数四分之一 |
189 | BD | ? | 普通分数二分之一 |
190 | BE | ? | 普通分数四分之三 |
191 | BF | ? | 倒置的问号 |
192 | C0 | à | 拉丁大写字母A带抑音符号 |
193 | C1 | á | 拉丁大写字母A带高音符号 |
194 | C2 | ? | 拉丁大写字母A带抑扬音符号 |
195 | C3 | ? | 拉丁大写字母A带鼻音符号 |
196 | C4 | ? | 拉丁大写字母A带分音符号 |
197 | C5 | ? | 拉丁大写字母A带上环符号 |
198 | C6 | ? | 拉丁大写字母AE |
199 | C7 | ? | 拉丁大写字母C带变音符号 |
200 | C8 | è | 拉丁大写字母E带抑音符号 |
201 | C9 | é | 拉丁大写字母E带高音符号 |
202 | CA | ê | 拉丁大写字母E带抑扬音符号 |
203 | CB | ? | 拉丁大写字母E带分音符号 |
204 | CC | ì | 拉丁大写字母I带抑音符号 |
205 | CD | í | 拉丁大写字母I带高音符号 |
206 | CE | ? | 拉丁大写字母I带抑扬音符号 |
207 | CF | ? | 拉丁大写字母I带分音符号 |
208 | D0 | D | 拉丁大写字母ETH |
209 | D1 | ? | 拉丁大写字母N带鼻音符号 |
210 | D2 | ò | 拉丁大写字母O带抑音符号 |
211 | D3 | ó | 拉丁大写字母O带高音符号 |
212 | D4 | ? | 拉丁大写字母O带抑扬音符号 |
213 | D5 | ? | 拉丁大写字母O带鼻音符号 |
214 | D6 | ? | 拉丁大写字母O带分音符号 |
215 | D7 | × | 乘法标志 |
216 | D8 | ? | 拉丁大写字母O带删除符号 |
217 | D9 | ù | 拉丁大写字母U带抑音符号 |
218 | DA | ú | 拉丁大写字母U带高音符号 |
219 | DB | ? | 拉丁大写字母U带抑扬音符号 |
220 | DC | ü | 拉丁大写字母U带分音符号 |
221 | DD | Y | 拉丁大写字母Y带高音符号 |
222 | DE | T | 拉丁大写字母THORN |
223 | DF | ? | 拉丁小写字母SHARP S |
224 | E0 | à | 拉丁小写字母A带抑音符号 |
225 | E1 | á | 拉丁小写字母A带高音符号 |
226 | E2 | a | 拉丁小写字母A带抑扬音符号 |
227 | E3 | ? | 拉丁小写字母A带鼻音符号 |
228 | E4 | ? | 拉丁小写字母A带分音符号 |
229 | E5 | ? | 拉丁小写字母A带上环符号 |
230 | E6 | ? | 拉丁小写字母AE |
231 | E7 | ? | 拉丁小写字母C带变音符号 |
232 | E8 | è | 拉丁小写字母E带抑音符号 |
233 | E9 | é | 拉丁小写字母E带高音符号 |
234 | EA | ê | 拉丁小写字母E带抑扬音符号 |
235 | EB | ? | 拉丁小写字母E带分音符号 |
236 | EC | ì | 拉丁小写字母I带抑音符号 |
237 | ED | í | 拉丁小写字母I带高音符号 |
238 | EE | ? | 拉丁小写字母I带抑扬音符号 |
239 | EF | ? | 拉丁小写字母I带分音符号 |
240 | F0 | e | 拉丁小写字母ETH |
241 | F1 | ? | 拉丁小写字母N带鼻音符号 |
242 | F2 | ò | 拉丁小写字母O带抑音符号 |
243 | F3 | ó | 拉丁小写字母O带高音符号 |
244 | F4 | ? | 拉丁小写字母O带抑扬音符号 |
245 | F5 | ? | 拉丁小写字母O带鼻音符号 |
246 | F6 | ? | 拉丁小写字母O带分音符号 |
247 | F7 | ÷ | 除法标志 |
248 | F8 | ? | 拉丁小写字母O带删除符号 |
249 | F9 | ù | 拉丁小写字母U带抑音符号 |
250 | FA | ú | 拉丁小写字母U带高音符号 |
251 | FB | ? | 拉丁小写字母U带抑扬音符号 |
252 | FC | ü | 拉丁小写字母U带分音符号 |
253 | FD | y | 拉丁小写字母Y带高音符号 |
254 | FE | t | 拉丁小写字母THORN |
255 | FF | ? | 拉丁小写字母Y带分音符号 |