Linux下读取windows下产生的文本文件,或者由某些linux系统上运行的应用产生的文本文件(日志等),放在其他系统或者应用使用时,经常可能出现乱码。这主要是文本编码不同而造成的。
查看文本文件编码:
1、linux命令: file fileName
file命令给出的文件格式常常不是很清晰。
2、vim命令:vim fileName
:set fileencoding
可看到当前文件编码格式
3、enca命令: enca fileName
即可显示文件编码信息。(enca具体使用根据环境可能需要安装)
转换文本编码的几种方式:
1、在linux环境下,可以用iconv命令来转换文本的编码。
iconv 是一个文件编码转换工具,其基本用法为:
iconv -f 原始编码 -t 目的编码 要转换的文件 -o 已转换的文件
例如:
将test.txt 文件从 gb2312 转换为 utf-8 编码,并输出为 converted.txt 文件,.
Linux下执行命令:
iconv -f gb2312 -t utf-8 test.txt -o converted.txt
使用 -l 选项查看支持的编码列表:
iconv -l
2、使用enconv转换文本编码
使用方法:
enconv -L zh_CN -x UTF-8 fileName
enconv可以自动判断文本编码和系统使用的编码,并把文本的编码转换为系统编码,可以批量转换。
3、使用vim编辑命令
vim fileName
在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8
文件名编码的转换:
1、convmv命令:
convmv -f 转换前编码 -t 转换后编码 fileName## -r 选项递归转换目录下所有子目录中的文件名
convmv -f gbk -t utf-8 *.txt ##可看到转换前后的对比
convmv -f gbk -t utf-8 --notest *.txt ##直接进行转换
===需要安装convmv的rpm包