python3
我是在尝试抓取网页的时候,遇到了这个错误的,原因时写文件的时候,编码是GBK,print没有问题,在网上简单百度了一下都是很多都是说print的时候出现了这个错误,于是就想到了文件也是有编码的,于是搜索了一下文件编码的问题,尝试指定文件的编码方式为utf-8,问题解决。
具体代报错位置:
print(page_source)
with open('test.html', 'w') as f:
f.write(page_source)
运行时报错:
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 29635: illegal multibyte sequence
改正后(修改文件的编码方式):
print(page_source)
with open('test.html', 'w', encoding='utf-8') as f:
f.write(page_source)