关于web请求中的编码解码问题

以下编解码都是针对内容包含中文的情况,否则也不需要编解码 :)
1、URL编解码
url例子:http://localhost:80/contextPath/servletPath/pathInfo?queryString
URL中文主要会出现在pathInfo和queryString中,这两部分的编解码是不同的。
a、pathInfo:
编码--浏览器端,默认utf-8,IE在选项--高级--国际中可取消发送utf-8,其他浏览器不清楚是否可以修改
解码--web服务器,tomcat中在<Connector URIEncoding='UTF-8'>设置UTF-8格式
b、queryString:
编码--浏览器端,默认gbk
解码--web服务器,在request.getParameter方法第一次被调用时解码,解码字符集为:1、如果服务器中<connector URIEncodeing='utf-8' useBodyEncodingForURI='true'> 中useBodyEncodingForURI设置为true,使用请求头ContentType中定义的charset的字符集进行解码 2、使用默认ISO-8859-1

2、HTTP Header编解码
编码--客户端设置或者浏览器。由于无法设置解码格式,所以最好不要在header中传递非ascii字符
解码--在调用request.getHeader时进行,默认iso-8859-1,不可以修改

3、post表单编解码
编码--浏览器,根据ContentType中的CharSet格式进行编码,但是默认浏览器提交表单时其content-type中是不含charset信息的。
解码--服务端,在调用用request.getParameter之前进行解码,也是根据ContentType中的Charset进行解码,另外可以通过request.setCharacterEncoding(charset)进行设置。

4、http body编解码
一般指的是response中的html内容。
编码--服务器,通过response.setCharacterEncoding来设置,会覆盖掉request.getCharacterEncoding的值,然后通过header中的content-type返回给客户端
解码--浏览器,通过响应头中的content-type中的charset进行解码,若没有charset,根据html中的<meta content='' charset=''>来解码,若仍然没有,则使用默认编码进行解码
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值