java web乱码浅析
分析过程不说了,直接说结果。
一。对于QueryString的解析
- 对urlencode 解析错误这个错误源于过时的javax.servlet.http.HttpUtils类
HttpUtils.parseQueryString(arg0) 这个类在解析中使用ISO-8859-1 字符集解析字符串 - (貌似规范要求这么做的)
二。对于post正文请求的解析
- 对于post的解析一般能正常解析。但是在第一次调用request.getParameter后设置编码无效,所以很多时候使用过滤器来解决这个问题,过滤会第一个获取到request并设置好惨。
- 在未设置编码(setCharacterEncoding)时使用ISO-8859-1 。。。解析
三。解决办法
- 对于QueryString我们可以直接拆解字符串进行解析(URLDecoder.decode(str, "UTF8"))
- 对于post数据在容器第一次解析我们不能获取到请求正文流和数据。可以使用new String(str.getBytes("ISO-8859-1 "),"UTF8") 解析
- 最彻底的办法,,自己写包装器在过滤器或者框架内对解析进行包装。
- 我们公司使用包装器在框架内解决,应用层一般不接触到HttpServletRequest
刚才看了apache的实现,直接用的把%后面的当成16进制解析成char