BIG5 字符集简介

BIG5 字符集简介

BIG5 字符集
 
BIG-5 码是通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”。它并不是一个法定的编码方案,存在着一些瑕疵,业界的评价也不高,但它广泛地被应用于电脑业,尤其是国际互联网中,从而成为一种事实上的行业标准。

关于BIG-5 码的背景,一直未见详细记载,兹据我掌握的资料,介绍如下:1983 年 10 月,台湾国家科学委员会、教育部国语推行委员会、中央标准局、行政院主计处电子资料处理中心共同制定了《通用汉字标准交换码》(Chinese Ideographic Standard Code for Information Interchange,简称CISCII 码),经试用修订,1986 年8月4日由台湾中央标准局公布为法定标准,标准编号为 CNS 11643。这一标准于1992 年5月21 日重新修订公布,更名为《中文标准交换码》(Chinese Standard Interchange Code)。1995 年1月4日,台湾中央标准局又公布了 CNS 11643-1《中文标准交换码使用方法》。

BIG-5 码是1984 年台湾资讯工业策进会根据《通用汉字标准交换码》制订的编码方案。至于为何称“BIG-5”,则未闻其详。

 Big-5 是一个双字节编码方案,其第一字节的值在 16 进制的A0~FE 之间,第二字节在40~7E 和A1~FE 之间。因此,其第一字节的最高位是1,第二字节的最高位则可能是1,也可能是0。

Big-5 码的图形符号及汉字,基本与 CNS 11643 标准的第一、第二字面 (Plane)一致,它收录 13461 个符号和汉字,包括:

1. 符号408个,编码位置为A140~A3FE(实际止于A3BF,末尾有空白位 置)。
2. 汉字13053个,分为常用字和次常用字两部分,各部分中的汉字按笔划/部首排列。其中:
a. 常用字5401个,编码位置为A440~C67E。包括台湾教育部颁布的《常用国字标准字体表》中的全部汉字4808个,台湾国中国小教科书常用字587个,异体字6个。
b. 次常用字7652个,编码位置为C940~F9FE(实际止于F9D5,末尾有空白位置)。包括台湾教育部次常用国字标准字体表》的全部汉字6341个,《罕用国字标准字体表》中使用频率较高的字 1311 个。
其余的A040~A0FE、C6A1~C8FE、FA40~FEFE 为空白区域。一些空白位置,经常被用于用户造字区,而且多存放香港常用字和粤语方言字。 

现在流行的BIG-5 码字库,在F9D6~F9DC 位置大都有7个常用字,据说为倚天系统所增。若计此7 字,则全数为13060个汉字,13468 个汉字和符号。此外,一些BIG-5 码字库,如Windows 繁体中文版的True Type 细明体(华康科技提供,2.0 版),在 F9DD~F9FE 位置还有33 个制表符和1个“  ■”符号。 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值