系统环境:Windows7 Tomcat7 JDK1.7
在使用百度语音API时,发现一个问题,通过web发起请求将语音转换为文字时,总是乱码;而在测试单元时,转换成功,不会出现乱码。然后用下面语句输出系统编码
Properties initProp = new Properties(System.getProperties());
System.out.println(Charset.defaultCharset());
System.out.println("当前系统编码:" + initProp.getProperty("file.encoding"));
System.out.println("当前系统语言:" + initProp.getProperty("user.language"));
web访问输出:
GBK
GBK
zh
测试单元输出:
UTF-8
UTF-8
zh
百度使用的是UTF-8,遂将系统字符集编码改为UTF-8,
System.getProperties().put("file.encoding", "UTF-8");
再次进行web测试,输出:
GBK
UTF-8
zh
当然,转换结果还是乱码
为什么Charset.defaultCharset()输出的编码,这个编码到底是什么编码?
查询结果:
原来 Charset.defaultcharset()指的是jvm输入流、输出流默认使用的编码/解码方式。是虚拟机的默认 charset。所以 我们只需要改变虚拟机的编码为UTF-8即可。
修改方法:
1).JDK修改
修改catalina.bat
添加:
set "JAVA_OPTS=%JAVA_OPTS% %LOGGING_CONFIG% -Dfile.encoding=UTF-8"
2).配置系统环境变量
name: JAVA_TOOL_OPTIONS
value: -Dfile.encoding=UTF-8
重启IDE,再次运行,字符集编码为UTF-8,转换成功