java上传文件到linux上防止文件名中文乱码

最新推荐文章于 2024-08-05 16:50:08 发布

storeWugt

最新推荐文章于 2024-08-05 16:50:08 发布

阅读量7.8k

点赞数 1

文章标签： java linux 编码乱码 unicode

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/storeWugt/article/details/78880011

版权

在windows系统下默认编码是GBK/GB2312的编码格式，linux上默认为utf-8的编码格式。

当我们在windows上上传文件的时候，JVM会根据本身的操作系统所默认的编码格式编译成unicode字节数组，进行存储。

然后解析的时候也会根据本身的操作系统默认的编码格式进行解析。

上传文件中文乱码时： JVM编译成gbk格式的unicode字节数组，然后解析成utf-8的格式，所以导致乱码。

乱码的本质是: 字符串原本的编码格式和读取解析的编码格式不一致所造成的。

在java中使用 new String(bytes,charset)；方法可以解决乱码问题。

bytes ：表示编译采用什么格式进行编译，charset : 表示使用什么格式进行解析

在windows上如:

String str="我很帅哦";

System.out.println(new String(str.getBytes(),"gbk")); 是正确的

System.out.println(new String(str.getBytes("utf-8"),"utf-8")); 也是正确的

System.out.println(new String(str.getBytes("gbk"),"utf-8")); 是错误的

那么如何将GBK 转化成utf-8呢? (实际上是unicode转成utf-8)

byte[] utfbytes=str.getBytes("utf-8");

String strFinsh=new String (utfbytes,"utf-8");

简写：System.out.println(new String(str.getBytes("utf-8"),"utf-8"));

utf-8转成gbk 也是一样的

new String(str.getBytes("gbk"),"gbk");

getBytes(charset)

在JDK中这样描述的:Encodes this String into a sequence of bytes using the named charset, storing the result into a new byte array.

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。