python 中编码问题

奔波在软件测试道路的小白

于 2018-08-27 19:32:49 发布

阅读量122

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/wf1532861978/article/details/82117755

版权

7 篇文章 0 订阅

订阅专栏

学习Python来一只在程序中的编码问题搞得没头没脑，今天总结一下：

计算机中是以二进制存储信息的，ASCII码以七位二进制数表示128个字符

unicode编码是采用四字节表示字符，但是在存储和传输中有不同的实现：UTF-8；UTF-16;UTF-32

UTF-32中每个字符固定占四位，按照Unicode编码完全映射；而UTF-8和UTF-16则属于变长编码，分别使用最少1个(UTF-8)或2个(UTF-16)字节到最多4个字节来编码。所以 UTF-8；UTF-16;UTF-32格式是编码后的格式；

str类只是用八字节表示一个字符，他是不存储编码信息的；

所以在使用编码和解码的时候：

对Unicode字节编码是正确的；对UTF字节解码是正确的

str=u"汉"
u1=str.encode('UTF-8')
#对Unicode字节进行编码
s1=u1.decode('UTF-8')
#对UTF-8格式进行解码成Unicode

但是对字符串编码和Unicode解码是不正确的

关注

专栏目录

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。