遇到这个问题很多次了,下面是解决方法
网页本身是utf-8,但我们爬取网页时用的是Unicode,但使用print()打印时,里面的内容应该是GBK编码,那么就需要我们将需要打印的数据后加上 .encode(‘GBK’,‘ignore’).decode(‘GBk’)
第一个GBK是忽略掉非法字符,然后再译码
例如:
print(需要打印的数据.encode(‘GBK’,‘ignore’).decode(‘GBK’))
Python打印时 报错UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position
最新推荐文章于 2024-02-28 11:56:47 发布