文件上传编码问题
1.编码问题的演示
我采用的是weblogic服务器,使用springmvc接收带文件的表单,content-type 为mutipart-formdata,页面采用的编码为UTF-8,但是项目采用的是GBK的编码。
从前端请求到服务器,也就是utf-8别编码成GBK,其实在这个过程中,就以及存在上传参数失真的情况。下面我用一个小demo显示出现问题的原因。
package com.example.demo.Controller;
import java.io.UnsupportedEncodingException;
public class TestDemo {
public static void main(String[] args) throws UnsupportedEncodingException {
System.out.println("我的去.xsl");
byte[] b = "我的去.xsl".getBytes("UTF-8");
for(int i=0;i<b.length;i++){
System.out.print(b[i]+" ");
}
String c = new String(b, "gbk");
System.out.println("");
System.out.println(c);
byte[] f = c.getBytes("gbk");
for(int i=0;i<f.length;i++){
System.out.print(f[i]+" ");
}
String d = new String(c.getBytes("gbk"),"UTF-8");
System.out.println("");
System.out.println(d);
byte[] g = d.getBytes("UTF-8");
for(int i=0;i<g.length;i++){
System.out.print(g[i]+" ");
}
}
}
我的去.xsl
-26 -120 -111 -25 -102 -124 -27 -114 -69 46 120 115 108
鎴戠殑鍘�.xsl
-26 -120 -111 -25 -102 -124 -27 -114 63 46 120 115 108
我的�?.xsl
-26 -120 -111 -25 -102 -124 -17 -65 -67 63 46 120 115 108
从上面的图可以看出,将utf转成gbk编码是就会有乱码的现象,gbk无法识别-69,所以用63代替。在从gbk到utf-8,自然会出现信息的丢失,而出现乱码的现象。
你好.xls
-28 -67 -96 -27 -91 -67 46 120 108 115
浣犲ソ.xls
-28 -67 -96 -27 -91 -67 46 120 108 115
你好.xls
-28 -67 -96 -27 -91 -67 46 120 108 115
从这张图可以看出,信息并没有丢失。那么上面时候会出现乱码呢,奇数个字符的时候是一定会出现乱码的,那么如何才能不乱码呢?
public class TestDemo {
public static void main(String[] args) throws UnsupportedEncodingException {
System.out.println("你燚.xls");
byte[] b = "你燚.xls".getBytes("UTF-8");
for(int i=0;i<