我记得刚开始使用tomcat写的第一个web应用,为中文乱码问题折腾了半天
还记得设置一个request.setCharacterEncoding()
指定UTF-8可以解决当时大部分问题(POST请求),那么这是为什么呢?那又为什么又有些还是乱码。。(GET请求)
还有就是tomcat升级到9之后无论你怎么request.setCharacterEncoding()
设置编码都没用了,又是为什么?
首先我们在浏览器输入一个url时,是不会有中文存在的
RFC 3986中规定URL中只允许包含24个英文字母以及基本的字符
浏览器会自动对url进行URLEncode,所以经常看到中文编程%啥%啥的,所以我们的get请求参数如果URLDecoder方式不一致会导致乱码,所以会出现get请求乱码,post请求不乱吗的原因
所以我们服务器收到客户端发过来的http请求,首先会对输入流进行URLDecode,这儿就是乱码的原因,所以我们在tomcat设置 可以解决乱码的原因。