tomcat的URIEncoding参数的简单理解

可先查看原文:从tomcat8.0开始,URIEncoding默认值不再是ISO8859-1,而变成了UTF-8

https://tomcat.apache.org/tomcat-8.0-doc/config/http.html页面上,有两个可配置参数:

  • URIEncoding 指定在%xx解码URL之后用于解码URI字节的字符编码,包括路径部分和查询字符串部分。如果未指定,将使用UTF-8
  • useBodyEncodingForURI 指定了contentType中指定的编码是否应该用于URI路径部分和查询字符串部分,而不是使用URIEncoding。此设置用于与Tomcat4.1.x兼容,Tomcat4.1.x时在contentType中指定的编码或使用Request.setCharacterEncoding方法显式设置的编码也用于URL中的查询字符串。useBodyEncodingForURI的默认值是false。注意: 1、此设置仅应用于请求的查询字符串get请求携带的参数叫查询字符串,即Query String Parameters,跟在请求路径部分后面,键值对形式,以&分隔。post请求携带的参数是放在请求体里面,叫表单数据,即Form Data,也是键值对形式,以&分隔)。与URIEncoding不同的是此设置不会影响请求URI的路径部分。2、如果请求字符编码未知(浏览器没有明确指明编码,同时没有在过滤器使用setCharacterEncoding方法设置编码),则默认编码始终为“ISO-8859-1”。URIEncoding设置对此默认设置没有影响。

在tomcat8.0之前,默认:URIEncoding=“ISO-8859-1”,useBodyEncodingForURI=false,此时的URI的查询字符串部分和请求体的编码(如果是post请求)都使用的是ISO-8859-1编码的。在tomcat8.0(包含)以后,URI的查询字符串部分编码的默认值从ISO-8859-1变成了UTF-8编码的,即URIEncoding的默认值变了(具体可参考各版本的org.apache.tomcat.util.http.Parameters类的两个常量:DEFAULT_BODY_CHARSET——指定请求体的默认编码,DEFAULT_URI_CHARSET——指定路径和查询字符串的默认编码)。可通过在server.xml配置文件中的Connector节点指定URIEncoding和useBodyEncodingForURI两个参数来改变查询字符串的默认编码:

  • URIEncoding影响查询字符串的编码和解码
  • useBodyEncodingForURI是否把请求体的编码作用于URI查询字符串

总结

  1. 请求体的默认编码如果在请求头的contentType未指定,同时没有在后端通过setCharacterEncoding方法设置编码,则默认值始终都是ISO-8859-1;URI路径部分和查询字符串部分的默认编码在tomcat8.0后就变成UTF-8了,故不用再为get请求乱码而烦恼。
  2. 所以,通常为防止get请求的路径和查询字符串乱码,会在server.xml配置URIEncoding=“UTF-8”;为防止post请求的请求体参数乱码,会在过滤器使用setCharacterEncoding方法设置编码。

参考阅读:
http–body编码的方式
http头部字段Content-Type约定请求和响应的HTTP body内容编码类型
浏览器对请求的URL编码行为

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值