文章转载自:
- ①https://www.cnblogs.com/yangqionggo/p/3333898.html -杨琼
- ②https://www.cnblogs.com/cxt-janson/p/10769009.html - 陈晓涛
linux下文件以及文件名的编码转换
1、查看文件编码方式–file 文件名(但是不是很准确)
yang@mint-linux ~ $ file baidu.html
baidu.html: HTML document, UTF-8 Unicode text, with very long lines, with no line terminators
yang@mint-linux ~ $ file sina.html
sina.html: HTML document, ISO-8859 text, with very long lines, with CRLF, LF line terminators<br>
2、转换文件编码–iconv -f 源编码 -t 目标编码 源文件名 > 目标文件名
yang@mint-linux ~ $ file sina.html
sina.html: HTML document, ISO-8859 text, with very long lines, with CRLF, LF line terminators
yang@mint-linux ~ $ iconv -f gbk -t utf8 sina.html > sina_utf8.html
yang@mint-linux ~ $ file sina_utf8.html
sina_utf8.html: HTML document, UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators
3、转换文件名编码–convmv -f 源编码 -t 目标编码 文件名 --notext(如果不加–notext则只是显示结果,不实际转换)(这个也可以批量转换该文件夹下面的所有文件名)
yang@mint-linux ~ $ touch 中文.txt
yang@mint-linux ~ $ convmv -f utf-8 -t gbk 中文.txt --notest
Your Perl version has fleas #37757 #49830
mv "./中文.txt" "./����.txt"
Ready!
但是如果文件要一个个转换,有几千个文件需要转换呢,使用上面的方法2,也忒苦逼了!换一个工具吧!
Linux下的文件批量转换为UTF8编码-enca
1、简介
enca是Linux下的文件编码转换工具。
2、安装
- 源码安装:http://dl.cihar.com/enca/
- Ubuntu:sudo apt-get install enca
3、使用方法
enca -L zh_CN file # 检查文件的编码
enca -L zh_CN -x UTF-8 file # 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x utf-8 * # 把文件夹下的所有文件转换为utf8编码
4、批量转换
目录转换报错不影响
find | grep -v '.svn' | xargs enca -L zh_CN -x UTF-8