python3字符编码转汉字的解决方案记录1

大家使用python3爬虫时,总是遇到字符编码问题。
如:\xb7\xaf\xe5\xb8\xa6\xe9\xa3\x8e这样的字符,令人十分苦恼。
下面我总结了几种解决方案:

  1. 爬到的数据通常是bytes类型,如requests.get的content属性。这时候,我们使用str(content, ‘utf8’)就可以把\xb7\xaf\xe5\xb8\xa6\xe9\xa3\x8e这样的内容转化成汉字了。
  2. 若是想要查看硬编码的一个字符串,如a = ‘\xb7\xaf\xe5\xb8\xa6\xe9\xa3\x8e’那么,使用a.encode(‘raw_unicode_escape’).decode()就可以print查看汉字了。

python3在实际使用时的字符编码问题远不止这几个,现在只能遇到了就记录一下,之后持续记录新的编码问题

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值