在ubuntu下运行python程序,总是报错,说编码不对不是utf-8(貌似是因为汉字部分出问题了),搜集资料后完成了转换。
1.文件编码查询
$ file 199801.txt
199801.txt: ISO-8859 text, with very long lines, with CRLF, LF line terminators
2.完成转换
$ sudo iconv -f 'gbk' -t 'utf-8' 199801.txt > 199801_utf8.txt
3.不放心的可以再查一下
$ file 199801_utf8.txt
199801_utf8.txt: UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators
此时编码转换已经完成,可以看到汉字部分已经正常了,o**k