常用的编码

ASCII码是标准化字符集,使用7个二进制位编码,可以表示128个字符,通常ASCII表示的是英文字母的二进制编码,

例如大写字母'A'的二进制编码为65,python代码如下:

>>> ord('A')
65
>>> chr(65)
'A'
Unicode是另外一种编码方式,是为了解决传统编码方式的局限而产生的,它为每种语言中的每个字符设置了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转化的要求。对每种语言的每个字符用两个字节长的ID号进行编码,从而规定出一个多达65536个字符的编码空间。

UTF-8编码是一种可变长度的Unicode的实现方法,是一个多字节的编码体系,英文对应Unicode的单字节,中文、日韩文对应Unicode的三字节。我们可以看出UTF-8与Unicode编码方式的区别是,编码长度的不同。Unicode采用固定长度的两个字节来表示,而UTF-8可以采用一到四个字节,不同的长度来表示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值