在Windows下运行 Python代码时经常遇到如下的提示
UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 45: illegal multibyte sequence
这是因为编码不对导致的,通常有两个地儿需要注意:
一个是控制台的编码,需要切换为Utf-8,在windows的命令行运行以下命令:
chcp 65001
然后在文件打开时,添加编码标志:
with open('toutiao_cat_data.txt', 'a',encoding="utf-8") as fp:
...
类似这样的操作即可。