有一次报错方式如下:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xad in position 0: invalid start byte
代码如下:
file=open('中国.txt','r',encoding="utf-8")
file.seek(2)
print(file.read())
file.close()
依旧出现错误:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xad in position 0: invalid start byte
百度翻译:
UnicodeDecodeError:“utf-8”编解码器无法解码位置0中的字节0xad:无效的起始字节
通过查阅资料发现由于编码格式不同utf-8与gbk汉字字节所占个数不同
GBK:
中文、英文、数字均用两个字节表示
UTF-8:
汉字占3个字节、数字占1个字节、英文字母占1个字节
总结:出现无法编码,乱码时,更改字符集格式或者根据编码格式进行调整