爬取网页数据时，出现UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf'

最新推荐文章于 2023-02-02 10:11:59 发布

无籽西瓜吃吗

最新推荐文章于 2023-02-02 10:11:59 发布

阅读量645

点赞数

本文链接：https://blog.csdn.net/qq_24326765/article/details/82724417

版权

UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf' in position 1235: illegal multibyte

网页的数据应该是'utf-8'编码,这个可以在网页的head上面看得到,然后你爬网页的时候会把它转化成Unicode,出问题的是在print()这儿,对于print()这个函数,他需要把内容转化为'gbk'编码才能显示出来. 然后解决办法是这样,你在转化后的Unicode编码的string后面,加上 .encode('GBK','ignore').decode('GBK') 也就是先用gbk编码,忽略掉非法字符,然后再译码。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

无籽西瓜吃吗

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬取网页数据时，出现UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf'

UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf' in position 1235: illegal multibyte网页的数据应该是'utf-8'编码,这个可以在网页的head上面看得到,然后你爬网页的时候会把它转化成Unicode,出问题的是在print()这儿,对于print()这个函数,他需要把内容转化为'...
复制链接

扫一扫