关于Unicode与UTF-8的说明

Unicode note

  1. ASCII码
  • ASCII码一共规定了128个字符的编码,这128个符号,只占用了一个字节的后面7个位,最前面的1位统一规定为0。

2.非ASCII码

  • 其他的语言用128个字符是不够的,所以就需要多个字节来表示符号,但是不同的国家有不同的字母,所以就算是多字节,每个字节可能在不同的国家就代表着不同的符号,比如汉字就多达10万多个,简体中文常见的编码方式是GB2312,使用两个字节来表示一个汉字,理论上能表示65536个字符。
  1. Unicode
  • 世界上存在着许多的编码方式,Unicode是一个很大的集合,能将世界上所有的符号收纳其中,那么乱码的问题就可以得以解决,Unicode是一个很大的集合,现在的规模可以容纳100多万个字符,每个符号的编码都是不一样的。

  • Unicode只是一个符号集,只规定了符号的二进制代码,并没有规定这个二进制代码应该怎么储存,也就是这个符号的存储有可能是一个字节,也有可能是两个字节,三个字节,四个字节等,所以现在就很容易出现问题: 1.如何能区别Unicode 和 ASCII码? 2.我们知道英文字母用一个字节表示就够了,如果Unicode统一规定每个符号用两个或者三个字节来存储,就会造成每个英文字符前必然有两到三个字节全是0,这对于存储来说会造成极大的浪费。

  • 为了解决上面的问,出现的结果:1.出现了Unicode的多种存储方式,也就是说有许多种不

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值