Linux解析文件乱码 Java,linux 下中文文件乱码问题解决

经常遇到:windows下通过xftp上传到linux服务器中的中文名文件出现乱码的情况。

业务场景:有一个公共的下载目录,里面可能会有中文名的文件,在web端显示的时候出现乱码,导致下载出错的问题。

首先保证linux的env设置了LANG=en_US.UTF-8

1、可以尝试在使用xftp上传问价你的时候,指定上传过程中的编码。如图:

ded41730bce98bad953bcb3abaf1c5db.png

一般来说,这样修改会解决乱码的问题。

但如果在Shell中(或通过http访问),仍是乱码……

2、使用convmv 或 iconv

仍然乱码的原因在于,Windows 的文件名中文编码默认为GBK,压缩或者上传后,文件名还会是GBK编码,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

convmv和 iconv 都是linux下的更改文件编码方式的工具。

安装

使用root用户安装

#安装iconv

yum install iconv

#convmv

yum install convmv

转化文件编码

使用root用户执行命令

#iconv

iconv -f gbk -t utf-8 -o outfile infile

-f为原来的编码方式,-t 为输出文件的编码方式, -o表示输出文件名,这利用outfile表示,最后跟上要更改编码方式的文件名sourcefile。

#convmv 转化命令 最后面跟文件目录

convmv -f gbk -t utf-8 -r --notest /u01/appinstall/

就是将/u01/appinstall/目录下原来文件名是gbk编码方式的全部改为utf-8格式的。这里 -f  后面为原来的编码方式,-t 后面是要更改为的编码方式, -r 表示这个目录下面的所有文件, –notest 表示马上执行,而不是仅仅测试而已。

convmv常用命令

-r 递归处理子文件夹

–notest 真正进行操作,默认情况下是不对文件进行真实操作

–list 显示所有支持的编码

–unescap 可以做一下转义,比如把%20变成空格

-i 交互模式(询问每一个转换,防止误操作)

文本内容转换 iconv

文件名转换 convmv

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值