如果遇到不知道什么编码的文件,检测该文件是什么编码.最好不要检测整个文档的编码,而是要检测文档中出现乱码的那部分内容的编码,以提高准确性.
import chardet
f=open(''a')
chardet.detect(f.read())
假设返回结果为GBK
则
for each in f:
print each.decode('GBK').encode('UTF-8')
问题解决
如果遇到不知道什么编码的文件,检测该文件是什么编码.最好不要检测整个文档的编码,而是要检测文档中出现乱码的那部分内容的编码,以提高准确性.
import chardet
f=open(''a')
chardet.detect(f.read())
假设返回结果为GBK
则
for each in f:
print each.decode('GBK').encode('UTF-8')
问题解决