字符集ASCII、GBK、UNICODE、UTF在储存字符时的区别

  ASCII编码(American Standard Code for Information Interchange,美国信息互换标准代码),使用127个8进制字节表示英文和半角字符。
  GBK (Guo Biao Kuozhan,国标扩展),当在ASCII 码的范围时,就用一个字节表示,然后每两个字节表示一个汉语和全角字符。
  UCS(Universal Multiple-Octet Coded Character Set)俗称UNICODE,所有的字符都是两个字节。ASCII字符前面全部补零,其他字符重新编码。
  UTF(UCS Transfer Format,万国码),当在ASCII 码的范围时,就用一个字节表示,一个中 文字符占3个字节,从unicode到uft-8并不是直接的对应。

中英文各字符集十进制编码对照表

字符ASCIIGBKUNICODEUTF8
a97979797
452183846315308991

中英文各字符集二进制编码对照表

字符ASCIIGBKUNICODEUTF8
a0110000101100001000000000110000101100001
10110000101000101001011000111111111010011001100010111111

  从第一个表中,我们可以看出英文字符(更准确的来说是ASCII字符集的字符)编码顺序没有改变,中文字符则都做了从新的编排。
  从第二个表中,我们很容易看出,四种字符编码集对英文字符的处理除了“UNICODE”用两个字节,其他都是使用一个字节来表示。对于中文字符,“GBK”和“UNICODE”使用两个字节来表示,UTF8使用三个字节来表示。

转载于:https://my.oschina.net/u/3473376/blog/895296

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值