错误码:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 2: illegal multibyte sequence
出错代码
f = open('西游记.txt').read()
但是在执行的时候会报错:
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 2: illegal multibyte sequence
问题
可能是读取的文本的编码格式不对,或者有特殊的非法字符
解决方法
- 编码转换
f = open('西游记.txt' ,encoding='utf-8').read()
- 添加属性忽略非法字符内容
f = open('西游记.txt', encoding='utf-8', errors='ignore' )