python中文乱码总结

本文主要介绍了Python2中字符串的编码方式,包括Unicode和str类型的表示及转换。还讨论了在HTTP请求响应处理中,如何在requests库中处理字符串编码,以及在不同编码环境下显示中文的注意事项。最后提供了一个字符串解码示例,展示了如何正确解码中文字符串。
摘要由CSDN通过智能技术生成

1、python2中的字符编码
str每个字符由8位字节表示,unicode每个字是由16位二进制数字表示。
有一个中文字符串:“授权token过期”,可以保存成string类型,也可以保存成为unicode类型;


使用unicode编码,则为:
>>> t=u"\u6388\u6743token\u8fc7\u671f"
>>> print t
授权token过期
>>> print isinstance(t, unicode) 
True




使用string编码,则是:
>>> s="\xe6\x8e\x88\xe6\x9d\x83token\xe8\xbf\x87\xe6\x9c\x9f"
>>> print s


授权token过期
>>> print isinstance(s, str) 
True


注:还需要将客户端xshell的显示格式设置为Unicode(UTF-8),否则显示是乱码,而不是中文字符


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值