Unicode和UTF-8区别

ASCII码

一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作[奇偶校验位]

奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;

偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

备注:48=‘0’ 65=‘A’ 97=‘a’

Unicode码:它前128个字符就是ASCII码,之后是扩展码

UnicodeUTF-8区别

Unicode为世界上所有字符都分配了一个唯一的数字编号,这个编号范围从 0x0000000x10FFFF(十六进制),有110多万,每个字符都有一个唯一的Unicode编号,这个编号一般写成16进制,在前面加上U+。例如:“马”的Unicode是U+9A6C

它是一种规定,Unicode本身只规定了每个字符的数字编号是多少,并没有规定这个编号如何存储(占几个字节存储,计算机中每八个二进制位组成了一个字节(Byte),计算机存储的最小单位就是字节),除了这种直接转换成二进制的方案外,还有其他方案,主要有UTF-8UTF-16UTF-32

UTF-8就是使用变长字节表示,顾名思义,就是使用的字节数可变,这个变化是根据 Unicode 编号的大小有关,编号小的使用的字节就少,编号大的使用的字节就多。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值