windows的乱码日常
不得不说,windwos是真的容易乱码。
今天调试项目,一个服务用HttpURLConnection发送http请求(请求头部中不会告知字符编码)到另外一个项目,另外一个项目拿到byte数组后转换成JSON对象。但是我发现转换成的json对象为null,就很奇怪。其他人包括服务器上都没有发生这种情况。
经过一阵研究,发现这个byte数组是GBK编码,不是UTF-8,另一边是按照UTF-8解码的,导致中文乱码,以至于无法被识别为JSON对象。
"GBK"是Windows的默认中文编码格式,cmd终端的使用的就是这种编码,所以终端里面日常乱码。
但是这个发送请求的代码在jar包里,不可更改。
那么问题就来了,怎么在不改变代码的情况下发送UTF-8编码的请求?
我发现在tomcat的vm option中加上-Dfile.encoding=UTF-8
就可以了。
但是我之前为了解决idea控制台显示中文乱码,已经在Custom VM Options(下图中的地方)中设置了jvm使用UTF-8编码,为什么要在tomcat中再设置一遍呢?真是搞不懂,只能说我有些怀念之前使用的MAC了,用它的时候从来就不会遇到乱码。
更新:研究了一下,猜测如下:
- Custom VM Options那里改的编码应该是idea控制台所接受的编码。在修改之前所接受的编码和cmd一样,只有GBK编码的字符串的汉字才能正常输出。
- tomcat的日志输出编码格式在本地tomcat中conf下的logging.properties中配置,默认UTF-8编码。
- 在服务启动配置中的配置才是真正修改所允许的服务的编码。