今天爬取百度搜索结果遇到的小问题,记录一下,防止以后再犯。
def saveHtml(file_name, data):
# 将文件写入
with open(file_name, "w") as f:
f.write(data)
很简单的代码,用来写入文件,但是有时会报UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xbb’ in position 113416: illegal multibyte sequence
都是windows文件编码的问题,windows新建文件默认编码是gbk的,当存储的数据是utf-8的时候就会报错,修改很简单,新建文件的时候指定编码即可
def saveHtml(file_name, data):
# 将文件写入
with open(file_name, "w", encoding='utf-8') as f:
f.write(data)
就是这样