UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq

解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq
错误代码:


with open("baidu.html",'w+') as f:
    f.write(results.text)

正确代码:


with open("baidu.html",'w+',encoding="utf-8") as f:
    f.write(results.text)

在抓取网页上面的一些源代码的时候,将uft-8的编码写入文档,并输出的时候,出现这了这个报错,说gbk无法编码\xbb

查找相关资料:

1.str转bytes叫encode,bytes转str叫decode

2.字符就是unicode字符,字符串就是unicode字符数组

原来,open()函数的默认编码不是utf-8,修改编码方式即可

write()函数涉及的问题,那就是它的参数必须是str,不能是bytes,也就是说f.write(result)中的result参数如果是bytes需要先decode成str(比如result.decode(‘utf-8’)),才能使用open()函数的encoding

  • 12
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值