从网站上爬文字信息,得到的数据经过筛选存到txt文档里面,但是会报错
UnicodeEncodeError: 'gbk' codec can't encode character '\uXXX' in position XXX: illegal multibyte sequence
我明明转的是utf-8格式,最终也没有找到好的解决办法,所以就将次报错信息忽视,并未影响文字信息的完整性
try:
filehandle.write(content)
except UnicodeError as u:
continue