最近遇到这么一个问题:
在自己的机器上测试一个功能,OK没任何问题;部署到服务器上以后,failed。
查日志,很容易发现问题,一个中文参数在服务器上是乱码,在自己的机器上正常。没错,肯定是字符集的问题。
服务器上was中的jvm配置的是utf-8,怎样查看自己机器上字符集呢?百度一下:
public class Test {
public static void main(String[] args) {
System.out.println(System.getProperty("file.encoding"));
}
}
再看一下究竟是哪里的字符集问题,之前使用HSSF解析Excel没有问题,用CSV解析时就出现字符集问题,所以问题肯定在CSV上,原来的做法:
br = new BufferedReader(new InputStreamReader(...));
改为:
br = new BufferedReader(new InputStreamReader(...),"utf-8");
另:获取中文字符的长度不同
public class Test {
public static void main(String[] args) {
System.out.println("测".getBytes(Charset.forName("UTF-8")).length);//结果:3
System.out.println("测".getBytes(Charset.forName("GBK")).length);//结果:2
}
}