问题描述:
Python 打开txt文件时提示,.txt must be utf-8,需要转格式。
此问题是在用Jieba分词时,导入 ‘四十万可用搜狗txt词库.txt’ 文件遇到的。
解决方案:
首先查看当前txt文件编码方式,
然后在Terminal中用命令转换编码格式。
注意事项:
输出文件命名要规范,建议输出 test.txt 即可
否则会输出失败。
1.查看源txt文件
file -I file_path
我的文件显示 text/plain; charset=utf-16le
说明我的txt文件编码是 UTF-16LE 格式的
1.转换编码格式
在命令中需要替换以下内容:
UTF-16LE 源文件格式
UTF-8 目标文件格式
original_file_path 源文件地址
target_file_path 目标文件地址
iconv -f UTF-16LE -t UTF-8 original_file_path > target_file_path