ISO/IEC 8859

来自维基百科,自由的百科全书

 

ISO 8859 ,全称ISO/IEC 8859 ,是国际标准化组织 (ISO)及国际电工委员会 (IEC)联合制定的一系列8 字符集的标准,现时定义了15个字符集。

 

引言

ASCII 收录了空格及94个“可印刷字符”,足以给英语 使用。但是,其他使用拉丁字母 的语言(主要是欧洲 国家的语言),都有一定数量的附加符号 字母,故可以使用ASCII及控制字符 以外的区域来储存及表示。

除了使用拉丁字母的语言外,使用西里尔字母 的东欧语言、希腊语泰语 、现代阿拉伯语希伯来语 等,都可以使用这个形式来储存及表示。

各种ISO 8859字符集

  • ISO 8859-8-I - 希伯来语(逻辑顺序)

由于英语 没有任何重音字母(不计外来词 ),故可使用以上十五个字集中的任何一个来表示。

至于德语 方面,因它除了 A-Z, a-z 外,只用 Ä, Ö, Ü, ä, ö, ß, ü 七个字母,而所有拉丁字集(1-4, 9-10, 13-16)均有此七个字母,故德语可使用以上十个字集中的任何一个来表示。

此系列中没有-12号的原因是,此计划原本要设计成一个包含塞尔特语族字符集的“Latin-7”,但后来塞尔特语族变成了ISO 8859-14 / Latin-8。亦有一说谓-12号本来是预留给印度 天城体 梵文 的,但后来却搁置了。

基本结构

每个字集定义最多96个字母或符号,在0xA0-0xFF根据不同字符集放入不同的字符。

ISO/IEC 8859十五个字符集的比较
Bin Oct Dec Hex 123456789101113141516
10100000240160A0NBSP
10100001241161A1¡Ą Ħ Ą Ё   ¡Ą ¡Ą
10100010242162A2¢˘˘ĸ Ђ  ¢¢Ē ¢ ¢ą
10100011243163A3£Ł £Ŗ Ѓ  £££Ģ £££Ł
10100100244164A4¤¤¤¤Є ¤¤¤Ī ¤Ċ
10100101245165A5¥Ľ  Ĩ Ѕ  ¥¥Ĩ ċ ¥
10100110246166A6¦Ś Ĥ Ļ І  ¦¦¦Ķ ¦ Š Š
10100111247167A7§§§§Ї  §§§§§§§§
10101000250168A8¨¨¨¨Ј  ¨¨¨Ļ Ø š š
10101001251169A9©Š İ Š Љ  ©©©Đ ©©©©
10101010252170AAªŞ Ş Ē Њ  ͺ× ªŠ Ŗ ªȘ
10101011253171AB«Ť Ğ Ģ Ћ  «««Ŧ « ««
10101100254172AC¬Ź Ĵ Ŧ Ќ ،¬¬¬Ž ¬ ¬Ź
10101101255173AD­­­­­­­­­­­­­­
10101110256174AE®Ž  Ž Ў   ®®Ū ®®®ź
10101111257175AF¯Ż Ż ¯Џ  ¯¯Ŋ Æ Ÿ ¯Ż
10110000260176B0°°°°А  °°°°° °°
10110001261177B1±ą ħ ą Б  ±±±ą ± ±±
10110010262178B2²˛²˛В  ²²²ē ²Ġ ²Č
10110011263179B3³ł ³ŗ Г  ³³³ģ ³ġ ³ł
10110100264180B4´´´´Д  ΄´´ī Ž Ž
10110101265181B5µľ µĩ Е  ΅µµĩ µ µ
10110110266182B6ś ĥ ļ Ж  Ά ķ
10110111267183B7·ˇ·ˇЗ  ····· ··
10111000270184B8¸¸¸¸И  Έ ¸¸ļ ø ž ž
10111001271185B9¹š ı š Й  Ή ¹¹đ ¹ ¹č
10111010272186BAºş ş ē К  Ί ÷ºš ŗ ºș
10111011273187BB»ť ğ ģ Л ؛»»»ŧ » »»
10111100274188BC¼ź ĵ ŧ М  Ό ¼¼ž ¼ Œ Œ
10111101275189BD½˝½Ŋ Н  ½½½½ œ œ
10111110276190BE¾ž  ž О  Ύ ¾¾ū ¾ Ÿ Ÿ
10111111277191BF¿ż ż ŋ П ؟Ώ  ¿ŋ æ ¿ż
11000000300192C0À Ŕ À Ā Р  ΐ  À Ā Ą À À À
11000001301193C1Á Á Á Á С ءΑ  Á Á Į Á Á Á
11000010302194C2Â Â Â Â Т آΒ  Â Â Ā Â Â Â
11000011303195C3Ã Ă  Ã У أΓ  Ã Ã Ć Ã Ã Ă
11000100304196C4Ä Ä Ä Ä Ф ؤΔ  Ä Ä Ä Ä Ä Ä
11000101305197C5Å Ĺ Ċ Å Х إΕ  Å Å Å Å Å Ć
11000110306198C6Æ Ć Ĉ Æ Ц ئΖ  Æ Æ Ę Æ Æ Æ
11000111307199C7Ç Ç Ç Į Ч اΗ  Ç Į Ē Ç Ç Ç
11001000310200C8È Č È Č Ш بΘ  È Č Č È È È
11001001311201C9É É É É Щ ةΙ  É É É É É É
11001010312202CAÊ Ę Ê Ę Ъ تΚ  Ê Ę Ź Ê Ê Ê
11001011313203CBË Ë Ë Ë Ы ثΛ  Ë Ë Ė Ë Ë Ë
11001100314204CCÌ Ě Ì Ė Ь جΜ  Ì Ė Ģ Ì Ì Ì
11001101315205CDÍ Í Í Í Э حΝ  Í Í Ķ Í Í Í
11001110316206CEÎ Î Î Î Ю خΞ  Î Î Ī Î Î Î
11001111317207CFÏ Ď Ï Ī Я دΟ  Ï Ï Ļ Ï Ï Ï
11010000320208D0Ð Đ  Đ а ذΠ  Ğ Ð Š Ŵ Ð Đ
11010001321209D1Ñ Ń Ñ Ņ б رΡ  Ñ Ņ Ń Ñ Ñ Ń
11010010322210D2Ò Ň Ò Ō в ز  Ò Ō Ņ Ò Ò Ò
11010011323211D3Ó Ó Ó Ķ г سΣ  Ó Ó Ó Ó Ó Ó
11010100324212D4Ô Ô Ô Ô д شΤ  Ô Ô Ō Ô Ô Ô
11010101325213D5Õ Ő Ġ Õ е صΥ  Õ Õ Õ Õ Õ Ő
11010110326214D6Ö Ö Ö Ö ж ضΦ  Ö Ö Ö Ö Ö Ö
11010111327215D7×× × × з طΧ  × Ũ × × Ś
11011000330216D8Ø Ř Ĝ Ø и ظΨ  Ø Ø Ų Ø Ø Ű
11011001331217D9Ù Ů Ù Ų й عΩ  Ù Ų Ł Ù Ù Ù
11011010332218DAÚ Ú Ú Ú к غΪ  Ú Ú Ś Ú Ú Ú
11011011333219DBÛ Ű Û Û л  Ϋ  Û Û  Ū Û Û Û
11011100334220DCÜ Ü Ü Ü м  ά  Ü Ü  Ü Ü Ü Ü
11011101335221DDÝ Ý Ŭ Ũ н  έ  İ Ý  Ż Ý Ý Ę
11011110336222DEÞ Ţ Ŝ Ū о  ή  Ş Þ  Ž Ŷ Þ Ț
11011111337223DFß ß ß ß п  ί ß ß ฿ß ß ß ß
11100000340224E0à ŕ à ā р ـΰ אà ā ą à à à
11100001341225E1á á á á с فα בá á į á á á
11100010342226E2â â â â т قβ גâ â ā â â â
11100011343227E3ã ă  ã у كγ דã ã ć ã ã ă
11100100344228E4ä ä ä ä ф لδ הä ä ä ä ä ä
11100101345229E5å ĺ ċ å х مε וå å å å å ć
11100110346230E6æ ć ĉ æ ц نζ זæ æ ę æ æ æ
11100111347231E7ç ç ç į ч هη חç į ē ç ç ç
11101000350232E8è č è č ш وθ טè č č è è è
11101001351233E9é é é é щ ىι יé é é é é é
11101010352234EAê ę ê ę ъ يκ ךê ę ź ê ê ê
11101011353235EBë ë ë ë ы ًλ כë ë ė ë ë ë
11101100354236ECì ě ì ė ь ٌμ לì ė ģ ì ì ì
11101101355237EDí í í í э ٍν םí í ķ í í í
11101110356238EEî î î î ю َξ מî î ī î î î
11101111357239EFï ď ï ī я ُο ןï ï ļ ï ï ï
11110000360240F0ð đ  đ ِπ נğ ð š ŵ ð đ
11110001361241F1ñ ń ñ ņ ё ّρ סñ ņ ń ñ ñ ń
11110010362242F2ò ň ò ō ђ ْς עò ō ņ ò ò ò
11110011363243F3ó ó ó ķ ѓ  σ ףó ó ó ó ó ó
11110100364244F4ô ô ô ô є  τ פô ô ō ô ô ô
11110101365245F5õ ő ġ õ ѕ  υ ץõ õ õ õ õ ő
11110110366246F6ö ö ö ö і  φ צö ö ö ö ö ö
11110111367247F7÷÷÷÷ї  χ ק÷ũ ÷ ÷ś
11111000370248F8ø ř ĝ ø ј  ψ רø ø ų ø ø ű
11111001371249F9ù ů ù ų љ  ω שù ų ł ù ù ù
11111010372250FAú ú ú ú њ  ϊ תú ú ś ú ú ú
11111011373251FBû ű û û ћ  ϋ  û û ū û û û
11111100374252FCü ü ü ü ќ  ό  ü ü  ü ü ü ü
11111101375253FDý ý ŭ ũ § ύ LRM ı ý  ż ý ý ę
11111110376254FEþ ţ ŝ ū ў  ώ RLM ş þ  ž ŷ þ ț
11111111377255FFÿ ˙˙˙џ    ÿ ĸ  ÿ ÿ ÿ

在0xA0的位置是“不换行空格”(no-break space)。

在0xAD的位置,大部分都放入了“选择性连字号”(soft hyphen,即只在一个文字在它的中间换行时才出现的连字号),若你使用的浏览器支援选择性连字号,上表将不会有任何显示。

黄色 的是ISO/IEC 8859-7:2003版本及ISO/IEC 8859-8:1999版本新增的符号 。LRM是“左至右记号”(left-to-right mark, U+200E)、RLM是“右至左记号”(right-to-left mark, U+200F)。

绿色 的是该字集未有定义 该位置。

0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定义。(控制字符是由ISO/IEC 6429 定义)。

ISO 8859与ISO-8859的关系

ISO/IEC 8859-n 之中,国际标准化组织只替每个字符集定义了最多96个字符(0xA0-0xFF)。

ISO-8859-n (在ISO与8859之间加上一连字号)则是由IANA 根据ISO/IEC 8859-n 所定义的编码表。它除了ISO/IEC 8859-n 的字符外,还包括ASCII (0x20-0x7E)字符及65个控制字符 (0x00-0x1F及0x7E-0x9F)。

类似ISO 8859的编码

ISO 8859-12 这个号码本来是预留给印度 天城体梵文 的,但最终未有定义。印度有它自己的编码-ISCII。

JIS X 0201日语 片假名 的字符集标准。它能与ISO 8859兼容。

VISCII越南语 在本土以外的侨民最常用的字符集标准。但因越南语有超过一百个重音字母,故它不兼容在ISO 8859。越南国家标准另外有一个符合ISO8859标准的字符集,但字符需要组合,像泰文一样。

ISO 6438 是非洲字母的字符集,但甚少被采纳。

 

 

http://www.unicode.org/Public/MAPPINGS/ISO8859/

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值