有时我们在进行文件读写的时候,会碰到编码错误的问题,这是我们对编码和解码不熟悉导致的
Unicode被称为万国码,主要是Unicode为每种语言设置了唯一的二进制编码表示方式,提供了从数学代码到不同语言字符集之间的映射,从而可以满足跨平台、跨语言之间的文本处理要求。因此要解决乱码问题可以使用Unicode作为中间介质来完成转换,比如可以先对要读入的字符使用UTF-8进行解码,然后再使用GBK进行编码。
file = open("test.txt",r)
print(file.read().decode("utf-8").encode("gbk"))
file.close()