可先查看原文:从tomcat8.0开始,URIEncoding默认值不再是ISO8859-1,而变成了UTF-8
在https://tomcat.apache.org/tomcat-8.0-doc/config/http.html页面上,有两个可配置参数:
- URIEncoding 指定在%xx解码URL之后用于解码URI字节的字符编码,包括路径部分和查询字符串部分。如果未指定,将使用UTF-8
- useBodyEncodingForURI 指定了contentType中指定的编码是否应该用于URI路径部分和查询字符串部分,而不是使用URIEncoding。此设置用于与Tomcat4.1.x兼容,Tomcat4.1.x时在contentType中指定的编码或使用Request.setCharacterEncoding方法显式设置的编码也用于URL中的查询字符串。useBodyEncodingForURI的默认值是false。注意: 1、此设置仅应用于请求的查询字符串(get请求携带的参数叫查询字符串,即Query String Parameters,跟在请求路径部分后面,键值对形式,以&分隔。post请求携带的参数是放在请求体里面,叫表单数据,即Form Data,也是键值对形式,以&分隔)。与URIEncoding不同的是此设置不会影响请求URI的路径部分。2、如果请求字符编码未知(浏览器没有明确指明编码,同时没有在过滤器使用setCharacterEncoding方法设置编码),则默认编码始终为“ISO-8859-1”。URIEncoding设置对此默认设置没有影响。
在tomcat8.0之前,默认:URIEncoding=“ISO-8859-1”,useBodyEncodingForURI=false,此时的URI的查询字符串部分和请求体的编码(如果是post请求)都使用的是ISO-8859-1编码的。在tomcat8.0(包含)以后,URI的查询字符串部分编码的默认值从ISO-8859-1变成了UTF-8编码的,即URIEncoding的默认值变了(具体可参考各版本的org.apache.tomcat.util.http.Parameters类的两个常量:DEFAULT_BODY_CHARSET——指定请求体的默认编码,DEFAULT_URI_CHARSET——指定路径和查询字符串的默认编码)。可通过在server.xml配置文件中的Connector节点指定URIEncoding和useBodyEncodingForURI两个参数来改变查询字符串的默认编码:
- URIEncoding影响查询字符串的编码和解码
- useBodyEncodingForURI是否把请求体的编码作用于URI查询字符串
总结
- 请求体的默认编码如果在请求头的contentType未指定,同时没有在后端通过setCharacterEncoding方法设置编码,则默认值始终都是ISO-8859-1;URI路径部分和查询字符串部分的默认编码在tomcat8.0后就变成UTF-8了,故不用再为get请求乱码而烦恼。
- 所以,通常为防止get请求的路径和查询字符串乱码,会在server.xml配置URIEncoding=“UTF-8”;为防止post请求的请求体参数乱码,会在过滤器使用setCharacterEncoding方法设置编码。
参考阅读:
http–body编码的方式
http头部字段Content-Type约定请求和响应的HTTP body内容编码类型
浏览器对请求的URL编码行为