ISO-8859系列标准

ISO8859 不是一个标准,而是一系列的标准,这套字符集与编码系统的共同特色是,以同样的码位对应不同字符集

中文名ISO8859
属 性一系列的标准
特 色同样的码位对应不同字符集
限 制定义至多 95 个字符
特 性其码位都在 0xA1 – 0xFF
要 求不准许折行的空格

编码

其基本精神是:
1.与 ASCII 相容,所以所有的低位皆不使用。
2.高位中的前 32 个码位 (0x80 – 0x9F 或 128–159),保留给扩充定义的 32 个控制码,称为 C1 控制码 (0–31 称为 C0 控制码)。
3.高位中第 33 个码位 (0xA0 或 160),也就是对应 ASCII 中 SP (空格) 的码位,总是代表 Non-breakable space,也就是不准许折行的空格。
4.每个字符集定义至多 95 个字符,其码位都在 0xA1 – 0xFF 或 161–255。
5.每个字符集收录欧洲某地区的共同常用字符。

符集介绍

ISO8859-1 字符集,也就是 Latin-1,是西欧常用字符,包括德法两国的字母。
ISO8859-2 字符集,也称为 Latin-2,收集了东欧字符。
ISO8859-3 字符集,也称为 Latin-3,收集了南欧字符。
ISO8859-4 字符集,也称为 Latin-4,收集了北欧字符。
ISO8859-5 字符集,也称为 Cyrillic,收集了斯拉夫语系字符。
ISO8859-6 字符集,也称为 Arabic,收集了阿拉伯语系字符。
ISO8859-7 字符集,也称为 Greek,收集了希腊字符。
ISO8859-8 字符集,也称为 Hebrew,收集了西伯莱 (犹太人) 字符。
ISO8859-9 字符集,也称为 Latin-5 或 Turkish,收集了土耳其字符。
ISO8859-10 字符集,也称为 Latin-6 或 Nordic,收集了北欧 (主要指斯堪地那维亚半岛) 的字符。
ISO8859-11 字符集,也称为 Thai,它是从泰国的 TIS620 标准字符集演化而来。
ISO8859-12 字符集,目前尚未定义。
ISO8859-13 字符集,也称为 Latin-7,主要函盖波罗的海(Baltic) 诸国的文字符号,也补充一些在 Latin-6 中遗漏的拉脱维亚 (Latvian) 字符。
ISO8859-14 字符集,也称为 Latin-8,它将 Latin-1 中的某些符号换成塞尔特语 (Celtic) 的字符。塞尔特族是指英伦外围的威尔斯人 (Welsh) 和盖尔人 (Gaelic)。
ISO8859-15 字符集,也称为 Latin-9,或者被匿称为 Latin-0,它将 Latin-1 中较少用到的符号删除,换成当初遗漏的法文和芬兰字母;还有,把英镑和日元之间的金钱符号,换成了欧盟货币符号。
ISO 8859-16,正式编号为ISO/IEC 8859-16:2001,又称Latin-10,这个字符集设计来涵盖阿尔巴尼亚语、克罗地亚语、匈牙利语、意大利语、波兰语、罗马尼亚语及斯洛文尼亚语等东南欧国家语言。 `

控制码

以下是 C1 控制码的号码和名称。

HEXDEC功能
80128PADDING CHARACTER
81129HIGH OCTET PRESET
82130BREAK PERMITTED HERE
83131NO BREAK HERE
84132INDEX
85133NEXT LINE
86134START OF SELECTED AREA
87135END OF SELECTED AREA
88136CHARACTER TABULATION SET
89137CHARACTER TABULATION WITH JUSTIFICATION
8A138LINE TABULATION SET
8B139PARTIAL LINE FORWARD
8C140PARTIAL LINE BACKWARD
8D141REVERSE LINE FEED
8E142SINGLE-SHIFT TWO
8F143SINGLE-SHIFT THREE
90144DEVICE CONTROL STRING
91145PRIVATE USE ONE
92146PRIVATE USE TWO
93147SET TRANSMIT STATE
94148CANCEL CHARACTER
95149MESSAGE WAITING
96150START OF GUARDED AREA
97151END OF GUARDED AREA
98152START OF STRING
99153SINGLE GRAPHIC CHARACTER INTRODUCER
9A154SINGLE CHARACTER INTRODUCER
9B155CONTROL SEQUENCE INTRODUCER
9C156STRING TERMINATOR
9D157OPERATING SYSTEM COMMAND
9E158PRIVACY MESSAGE
9F159APPLICATION PROGRAM COMMAND

字符编码

十进制十六进制字符说明
160A0间断空间
161A1?倒置的叹号
162A2美分标志
163A3英镑标志
164A4货币标志
165A5日元标志
166A6?BROKEN BAR
167A7§节标志
168A8?分音符号
169A9?版权标志
170AAa阴性顺序指示
171AB?左指向双角引号
172AC?NOT SIGN
173AD连字符
174AE?已注册标志
175AFˉ长音符号
176B0°度标志
177B1±正负标志
178B22上角标2
179B33上角标3
180B4?高音重音符号
181B5μMICRO SIGN
182B6?PILCROW SIGN
183B7·中间点
184B8?变音符号
185B91上角标1
186BAo阳性顺序指示
187BB?右指向双角引号
188BC?普通分数四分之一
189BD?普通分数二分之一
190BE?普通分数四分之三
191BF?倒置的问号
192C0à拉丁大写字母A带抑音符号
193C1á拉丁大写字母A带高音符号
194C2?拉丁大写字母A带抑扬音符号
195C3?拉丁大写字母A带鼻音符号
196C4?拉丁大写字母A带分音符号
197C5?拉丁大写字母A带上环符号
198C6?拉丁大写字母AE
199C7?拉丁大写字母C带变音符号
200C8è拉丁大写字母E带抑音符号
201C9é拉丁大写字母E带高音符号
202CAê拉丁大写字母E带抑扬音符号
203CB?拉丁大写字母E带分音符号
204CCì拉丁大写字母I带抑音符号
205CDí拉丁大写字母I带高音符号
206CE?拉丁大写字母I带抑扬音符号
207CF?拉丁大写字母I带分音符号
208D0D拉丁大写字母ETH
209D1?拉丁大写字母N带鼻音符号
210D2ò拉丁大写字母O带抑音符号
211D3ó拉丁大写字母O带高音符号
212D4?拉丁大写字母O带抑扬音符号
213D5?拉丁大写字母O带鼻音符号
214D6?拉丁大写字母O带分音符号
215D7×乘法标志
216D8?拉丁大写字母O带删除符号
217D9ù拉丁大写字母U带抑音符号
218DAú拉丁大写字母U带高音符号
219DB?拉丁大写字母U带抑扬音符号
220DCü拉丁大写字母U带分音符号
221DDY拉丁大写字母Y带高音符号
222DET拉丁大写字母THORN
223DF?拉丁小写字母SHARP S
224E0à拉丁小写字母A带抑音符号
225E1á拉丁小写字母A带高音符号
226E2a拉丁小写字母A带抑扬音符号
227E3?拉丁小写字母A带鼻音符号
228E4?拉丁小写字母A带分音符号
229E5?拉丁小写字母A带上环符号
230E6?拉丁小写字母AE
231E7?拉丁小写字母C带变音符号
232E8è拉丁小写字母E带抑音符号
233E9é拉丁小写字母E带高音符号
234EAê拉丁小写字母E带抑扬音符号
235EB?拉丁小写字母E带分音符号
236ECì拉丁小写字母I带抑音符号
237EDí拉丁小写字母I带高音符号
238EE?拉丁小写字母I带抑扬音符号
239EF?拉丁小写字母I带分音符号
240F0e拉丁小写字母ETH
241F1?拉丁小写字母N带鼻音符号
242F2ò拉丁小写字母O带抑音符号
243F3ó拉丁小写字母O带高音符号
244F4?拉丁小写字母O带抑扬音符号
245F5?拉丁小写字母O带鼻音符号
246F6?拉丁小写字母O带分音符号
247F7÷除法标志
248F8?拉丁小写字母O带删除符号
249F9ù拉丁小写字母U带抑音符号
250FAú拉丁小写字母U带高音符号
251FB?拉丁小写字母U带抑扬音符号
252FCü拉丁小写字母U带分音符号
253FDy拉丁小写字母Y带高音符号
254FEt拉丁小写字母THORN
255FF?拉丁小写字母Y带分音符号
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值