请求参数中的中文读取问题

请求参数中的中文读取问题
HTTP协议规定浏览器向web服务器传递的参数信息中不能出现某些特殊字符,
而必须对这些字符进行URL编码后再传递。Web服务器受到参数后,首先从中分离出每个
参数的名称和值部分,再进行URL解码,解码得到字节数组,然后按照某种字符集转换成
Unicode码

浏览器对form表单中输入的中文字符都会进行URL编码,再传送给web服务器。
浏览器会按照当前显示页面时所采用的字符集编码来进行URL编码。

5种情况:
1.对于HTTP请求消息的请求行中的URL地址后的参数(get方法提交表单),getParameter等方法进行
URL解码时所采用的字符集编码在Servelt规范中没有明确规定,它由各个Servlet引擎厂商
自行决定。对于这种情况,Tomcat中的ServletRequest对象的getParameter等方法默认
采用ISO8859-1进行解码
2.对于post方式下的"application/x-www-form-urlencoded"编码格式的实体内容,
getParameter等方法以ServletRequest对象的getCharacterEncoding()方法返回的字符集对
其进行URL解码。如果getCharacterEncoding()方法返回null,则采用ISO8859-1
3.ServletRequest接口中定义了一个setCharacterEncoding方法来设置请求消息中
的实体内容的字符集编码名称,getParameter方法以该方法设置的字符集编码对实体内容
进行URL解码。setCharacterEncoding方法来设置的字符集只影响getParameter方法对POST
过来的内容进行URL解码的结果,而不能影响URL地址后的参数进行URL解码的结果
4.在Tomcat配置中,连接器(HTTP Connector)属性中有一个URIEncoding和
useBodyEncodingForURI属性,这两个属性设置对URL后的附加参数进行URL解码时该如何选择
字符集编码。URIEncoding用于制定URL后的附加参数的字符集编码,useBodyEncodingForURI
则说明是否采用实体内容的字符集编码设置来替代URIEncoding的设置,也就是说当
useBodyEncodingForURI属性设置为true时,ServletRequest.setCharacterEncoding方法设置
的字符集编码也影响getParameter等方法对URL地址后的参数进行URL解码的结果。(在/%TomCat_Home%/
conf\server.xml文件中找到 <Connector>标记,然后在后面加上useBodyEncodingForURI=true)
5.不同厂商的Servlet引擎内部进行URL解码的处理方式可能不一样,所以URL后面的
中文参数最好还是进行URL编码。可以采用java.net.URLEncoder.encode()方法进行编码,然后
浏览器中所显示出来的就是一堆百分号之类的字符
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值