window到linux文件名乱码和文件内容乱码解决总结

       window系统一般文件名编码为gbk,文件内容编码这个需要通过编辑器查看或者设置,找个editplus文本编辑器就可以处理文本内容编码。

        那么在window上显示正常的文件到linux上的时候,常常会因为中文问题导致乱码,比如文件名乱码和文件内容乱码。

查看linux设置的编码:

[root ~]#  echo $LANG
zh_CN.UTF-8
[root ~]# locale
LANG=zh_CN.UTF-8
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"

LC_ALL=

上门是基于centos6.5查询和设置,之前是设置USA.UTF-8,后面把它设置支持中文zh_CN.UTF-8,需要安装支持中文的包

yum -y groupinstall chinese-support  

修改和设置编码

[root ~]# vim /etc/sysconfig/i18n
LANG="zh_CN.UTF-8"

[root ~]# source /etc/sysconfig/i18n

经过上面的设置后,开始基于xftp和xshell做下面的实验。

xshell在文件--》属性--》终端设置编码,xftp暂时不设置。


一、linux文件名乱码。

1、创建测试目录和测试文件,文件名带有中文字符,文件内容带有中文字符。通过xftp上传到linux服务器:


在xftp里面显示中文一切正常。

2、在linux下面显示发现文件名乱码。同时用file 文件名查看当前文件


此时做一个转码操作:

convmv --notest --nosmart -f gbk -t utf8 -r 文件或者目录

-f from从什么编码
-t to改成什么编码
--nosmart 如果已经是utf-8 忽略
-r 包含所有子目录

--notest 不加表示只列出有什么需要转换的,不做实际转换,所以一定要加


上面步骤已经搞定文件名乱码问题了,下面是通过设置xftp编码对应linux编码。

3、xftp文件--》属性--》选项,设置为utf-8编码--文件名传输编码。这样显示的文件名就直接是uft-8编码,linux显示就不会是乱码。



二、文件内容乱码。

1、用cat 查看发现内容乱码


2、iconv -f gbk -t utf8 test测试.txt -o test测试.txt

经过测试已经把文件乱码内容成功转码,

同时iconv不做覆盖的时候另外一种写法iconv -f gbk -t utf8 haha.txt > haha.txt.utf8

这种写法不能覆盖,原文件为空。



3、另外一种就是平时写的sell脚本,在window那边传过来需要转码。

安装:yum install -y dos2unix

执行相关命令dos2unix  xxx.sh



             上面两种解决方法基本上解决了window到linux文件名乱码和文件内容问题,后续遇到新的问题再追加进来。


阅读更多 登录后自动展开
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页