之前用Python写爬虫小程序时遇到了这样的报错:UnicodeEncodeError: ‘gbk’ codec can’t encode character,感觉是文件编码格式的问题,但是就是不知道怎么解决,后来查了半天资料才找到解决办法。
现将方法记录如下,以免日后再次遇到时忘记了。
办法十分简单,在f = open('XXX.txt','a+',encoding='utf-8') 里加上encoding='utf-8'这个参数就行了。
出错的原因是网页及python的编码都是utf-8,在写进txt时Windows默认转码成gbk,遇到某些gbk不支持的字符就会报错。在打开文件时就声明编码方式为utf-8就能避免这个错误。
资料链接:https://blog.csdn.net/vito21/article/details/53490435