python 字符集

字符集编码&解码

for i in ['replace','ignore','backslashreplace']:
    print("AaBbCc你好,世界!".encode('utf-8').decode('ascii',errors=i))

执行结果:
AaBbCc������������������
AaBbCc
AaBbCc\xe4\xbd\xa0\xe5\xa5\xbd\xef\xbc\x8c\xe4\xb8\x96\xe7\x95\x8c\xef\xbc\x81

replacee、ignore、backslashreplace分别是解码错误时选用的方法:替换成问号、忽略、以字节形式显示;

应用1

浏览器中网站是GBK编码,request get后返回的数据其中的汉子是以字节形式返回,我们需要用“utf-8解码得到正确的汉子。

import requests
ua={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'}
url='https://file-contents-pqr.oss-cn-beijing.aliyuncs.com/rC8jykTcyXJWKKxR?OSSAccessKeyId=LTAI4FoEPTasjWkqu1meFaHK&Expires=1584454798&Signature=ZJHaruVbSUybBazuX3UxhRsjlYQ%3D'
a=requests.get(url,ua).content
print(a)
b=a.decode('utf-8')
print(b)

执行结果:
"B:\xe5\x89\xaf\xe6\x9c\xac\xe5\xb7\xa5\xe4\xbd\x9c\xe8\xa1\xa81","C*0.5","G:KOjlf"]
"B:副本工作表1","C*0.5","G:KOjlf"]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值