问题现象:
在windows下的tomcat中运行wechat4j没有中文乱码问题,但把工程打包成*.war部署到ubuntu14.04的tomcat中就出现了中文乱码问题。
在网上查资料,按网上的说法也添加了一些代码,诸如
request.setCharacterEncoding("utf-8");
或
<Connector port="80" protocol="HTTP/1.1" URIEncoding="utf-8" connectionTimeout="20000" redirectPort="8443" />
等等,都是一些常见的jsp乱码解决方法,网上一找一大把,其实说白了就是一句话,统一编码标准,以我以往的经验,
需要设置编码标准时一般统一设置为uft-8即可避免中文乱码问题。(关于理解和解决常见的java中文乱码问题,推荐三篇很好的文章:
Java中的乱码问题、
深入剖析Java编程中的中文问题及建议最优解决方法--上篇 、
深入剖析Java编程中的中文问题及建议最优解决方法---下篇)
但这次无论我怎么设置编码格式,都会在ubuntu上出现乱码。
错误原因:
经过排查各种错误原因,发现在WechatSupport类dispatch()方法中代码(代码作用为把request数据流转化为字符串)
StreamUtils.streamToString(request.getInputStream());
和setPostData(String xmlStr)方法中代码(代码作用为把xmlStr字符串转化为WechatRequest类的对象)
JaxbParser jaxbParser = new JaxbParser(WechatRequest.class);
this.wechatRequest = (WechatRequest)jaxbParser.toObj(xmlStr);
和response()方法中代码(代码作用为把wechatResponse对象转化为xml对象)
JaxbParser jaxbParser = new JaxbParser(WechatResponse.class);
//设置
jaxbParser.setCdataNode(WechatResponse.CDATA_TAG);
result = jaxbParser.toXML(wechatResponse);
以及其他使用了JaxbParser类进行xml序列化或反序列化的代码,在执行时均未能识别中文编码,即均未按utf-8进行解码。
本质原因:
经过不断查资料和分析,发现以上所述代码调用了系统的字符集进行了解码,而我所使用的ubuntu14.04默认的字符集并不是utf-8,所以无论我在代码中怎么设置使用utf-8字符集解码均不能彻底解决问题。
解决办法:
所以根本的解决办法是修改系统默认的字符集或修改jvm默认的字符集(默认情况下jvm是调用的系统的字符集进行解码)。找准方向就容易查询解决方案了,最后看到这篇文章——tomcat环境中file.encoding的修改方法(非常感谢该文作者的分享!),原来解决问题的办法很简单,只需要在tomcat的启动参数中设置
export JAVA_OPTS="$JAVA_OPTS -Dfile.encoding=UTF-8"
-Dfile.encoding=UTF-8表明jvm使用utf-8进行解码。重启tomcat,于是,中文乱码问题彻底解决。(注意:设置-Dfile.encoding=UTF-8也会有些副作用,详细参考文章系统变量file.encoding对Java的运行影响有多大?)
——因为分工,人类创造了财富;因为分享,知识插上了翅膀