【一起学习输入法】华宇拼音输入法开源版本解析(6)

【一起学习输入法】华宇拼音输入法开源版本解析(6)

          原创:good02xaut(CSDN)

 

    1. 输入法运行原理
      1. 汉字编码体系

汉字的编码就是汉字对应的字符集,历史上共有5种:

  1. GB2312编码字符集:1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。
  2. BIG5编码字符集:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。
  3. GBK编码字符集:1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。
  4. GB18030编码字符集:2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。
  5. Unicode编码字符集:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。

 

以汉字“啊”为例,对应如下5种编码的码值,兼容性问题一目了然。

同一个汉字在不同的应用场景下采用何种字符集需要在设计阶段明确,以确保在数据交换、处理、显示中能够正确识别。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值