从ASCII编码到UNICODE编码

       计算机产生之初,在美国,使用8个二进制数,即一个字节去表示字符就足够了,编码0-9,A-Z,a-z,一些特殊的符号,128个完全够用,这就是最初的ASCII编码,为了编码一些特殊的图形,以及一些外国语言,还要用到剩下的128个编码,这就是扩展ASCII;后来慢慢地计算机走向全世界,发现这样子编码是完全不够的,比如我们国家的汉字,远远超过了256个,这时候就想到了用两个字节去编码,共有2^16=66536种情况,但是相应的也就有了问题,原来的ASCII码怎么处理,不能说你编了汉字之后,原来的英文字符就不能用了,所以解决办法是用高字节用0xA1-0xF7,低字节用0xA1-0xFE来表示一个汉字,原来0-127编码的英文字符照样用,再后来发现还不够,就干脆对于低字节的部分不限制,当读到在高字节范围内的编码,就认为下一个字节是低字节的编码,这就是最初的GBK,国标码,这是属于双字节编码的(DBCS),但是这也就出现了问题,就是统一的问题,就拿汉字来说,中国、台湾、香港编码都不一样,不同的双字节编码完全不兼容。在这样的背景下,就出现了UNICODE,它是国际组织统一制定的,规定所有字符都是两个字节,包括英文字符(高位填零),并且将其他的语言进行了编码。UNICODE做到了统一,但是也是一种浪费,因为对于英文来说,完全浪费了一个字节。随着内存的增大,对于内存方面的限制越来越宽松,同时互联网发展,文件的传输,需要字符做到统

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值