Java中乱码向来是让人头疼的一件事.原因是其中转码的地方太多了.
jsp 页面,request 参数 ,数据库读取存储, tomcat 设置 ,读取各种文件.这里就不提了.比较常见,网上很多.
邮件标题乱码,为什么标题会乱码,查看一下邮件源码.
Subject: =?ANSI_X3.4-1968?B?Pz8/Pz8=?= MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="----=_Part_21_1885302116.1359975400518" ------=_Part_21_1885302116.1359975400518 Content-Type: text/plain; charset=us-ascii Content-Transfer-Encoding: 7bit
我以为是subject 字符集错了,现在很明显是西欧字符集. 于是就设置subject
BASE64Encoder enc = BASE64Encoder();
msg.setSubject("=?UTF-8?B?"+enc.encode(subject.getBytes())+"?=");
查看源码
Subject: =?UTF-8?B?Pz8/Pw==?=
又尝试了 mailMessage.setHtmlEncoding(htmlEncoding);
解析字符集改了.但是还是乱码.
猜测是不是这个字符本事有问题,想起是不是jvm 默认字符集作祟.于是查看
System.getProperty("file.encoding"). --->ANSI_X3.4-1968
果然就是它.
启动虚拟机的时候如果没有指定应该是系统默认字符集,查看系统字符集
locale -a C
好吧! 我不知道C是什么? 难道是china??? 哈哈! 估计是一个简码.
查看/etc/sysconfig/i18n
cat /etc/sysconfig/i18n LANG="zh_CN.UTF-8"
于是
source /etc/sysconfig/i18n
再查看 locale -a 已经是utf-8.
重启jvm.本以为信心满满.结果jvm的字符集还是没变.
做了这么多操作还是无效,真是惹火了我.可能是我理解的不够彻底.难道是加载先后顺序???于是我只能暴力一点了,修改启动jvm的参数
JAVA_OPTS="$JAVA_OPTS -Dfile.encoding=UTF-8"
成功了.
java 中字符集转换有很多.编译 执行期都需要转换.因为java本身是UNICODE.
如果在各种应用场景里就会有更复杂,比如 eclipse,tomcat等等. 需要仔细分析.究竟是那个环节的问题.