GET和POST乱码问题剖析

1、文章1

最近遇到一个问题:用get方法传递中文有问题,用post没有问题。 

问题简单的描述是这样的

<a href="userGroup.jsp?userGroupName=<%=userGroupName%>">aa</a> 

这里userGroupName是中文 

userGroup.jsp页面得到的userGroupName却是乱码。 

每个页面也都有<%@ page language="java" pageEncoding="GBK" %>说明。 

 

后来上网找了一下才知道:pageEncoding这个只对post起作用。get方法提交时,大家可以从地址栏里看到提交的参数,这是因为get方法传递是作为报文头提交的,而pageEncoding对报文头是没有作用的,所以仍然按照 iso8859-1编码,才出现了刚才的乱码问题。而post提交的是form表单的内容,pageEncoding指定了它的编码,所以他会按照指定编码传递。 

 

问题清楚了,下面就来解决它: 

 

由于tomcatservlet实现中ServletRequest.setCharacterEncoding方法未对HTP报文头的内容进行解码,因此 

使用HTTPGET方法提交的数据将不能正确的解码.解决方案为修改其服务器的配置server.xml文件中对HTTP协议的 

Connector配置,加上URIEncoding="GBK"属性,配置完成以后"可能"的内容为 

< Connector port="8080" 

maxThreads="150" minSpareThreads="25" maxSpareThreads="75" 

enableLookups="false" redirectPort="8443" acceptCount="100" 

debug="0" connectionTimeout="20000"  

disableUploadTimeout="true" URIEncoding="GBK" />  

大功告成!

 

2、文章2

表单提交中,method="GET" 为默认值,通过url提交过去,形式为:http://localhost:8081/test.jsp?username=bebe0453&password=082628&submit=%C8%B7%EF%BF%BD%EF%BF%BD

 

而 method="POST" ,则为隐式提交,在浏览器地址栏不会出现参数。

 

POST更加保密,且提交过去的容量更大,一般都采用POST提交。 

 


3、文章3

 

在项目中,我们经常遇到需要在jsp页面切换中传递中文字符。这主要有两种方式。 

 

Ø URL方式,例如:http://website/test1.jsp?act=add&type=苹果¶m=%20D%20B  

Ø FORM方式,例如:  

   <form name=test  mehtod="post">

        <input type=hidden name=text2 value="中文">

        <input type=text name=text1>

        <input type=submit value=submit>

 </form>

我们将针对这两种情况,分别提供中文正确传递的解决方法。

 

情况1URL方式

例如:http://website/test1.jsp?act=add&type=苹果¶m=%20D%20B

 

一般来说我们很少直接在URL里面把参数写成中文,如例子中的"type=苹果"这样传递。如果出现这种情况,在我们的接收参数的页面我们只需要做个简单的转换就可以了。  

代码test1.jsp(主要部分)

       <%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

       <%

           String type = request.getParameter("type");

 

           String result = new String(type.getBytes("iso-8859-1"), "gb2312");      

 

           out.println(result);   

  %>

 

更普遍的做法,就是对url中的中文字符进行编码,变成类似type=%20D%20B这样的字符。  

代码MyJsp1.jsp

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

<%@ page import="java.net.*" %>

 

<a href='./MyJsp2.jsp?act=<%=URLEncoder.encode("中国人 非常好")%>'>test</a>

 

代码MyJsp2.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

<%@ page import="java.net.*" %>

 

String tempVal = URLDecoder.decode(request.getParameter("act"));

out.println(new String(tempVal.getBytes("ISO-8859-1"), "gb2312"));

 

情况2FORM方式

 

     请注意,我们只是讨论在<form enctype="application/x-www-form-urlencoded" >这种形式的中文情况,因为在enctype="multipart/form-data"的时候通过解析出来中文也可以运用这种方法进行字符转化,所以不再重复讨论。

 

<form method=post>这种情况最简单。  

 代码MyJsp1.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

 

 <form action="./MyJsp2.jsp" method="post" enctype="application/x-www-form-urlencoded" >

 <input type=hidden name=act value=动作 />

 <input type=submit value=ok>

 </form>

 

代码MyJsp2.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

request.setCharacterEncoding("gb2312");

 

out.println(request.getParameter("act"));

 

或者

 

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

 

String tempVal = request.getParameter("act");

 

out.println(new String(tempVal.getBytes("ISO-8859-1"), "gb2312"));

 

<form method=get>情况。  

代码MyJsp1.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

 

 <form action="./MyJsp2.jsp" method="get" enctype="application/x-www-form-urlencoded" >

        <input type=‘hidden’ name=‘act ’value=‘动作’ />

        <input type=‘submit’ value=‘ok’>

 </form>

 

代码MyJsp2.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>

 

String tempVal = request.getParameter("act");

 

out.println(new String(tempVal.getBytes("ISO-8859-1"), "gb2312"));

 

<!-- 编码过滤器 -->
<filter>
<filter-name>Spring character encoding filter</filter-name>
<filter-class>
org.springframework.web.filter.CharacterEncodingFilter
</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>gb2312</param-value>
</init-param>
< /filter>
< filter-mapping>
<filter-name>Spring character encoding filter</filter-name>
<url-pattern>/*</url-pattern>
< /filter-mapping>

这段配置就相当于在代码中写了如下代码:(servlet)

request.setCharacterEncoding("gb2312");
response.setCharacterEncoding("gb2312");

在jsp页面中,设置页面的存储编码和页面输出时的编码:

<%@ page language="java" contentType="text/html; charset=gb2312"
pageEncoding="gb2312"%>

这样,就统一了编码为gb2312

这种方式在post提交表单中含有中文时没有问题。但是在用get提交时,如果含有中文,就会出现类似于? ? ?的乱码问题。为什么会这样呢,造成这种现象的原因是Tomcatgetpost两种提交方式的处理方法不一样造成的。自从Tomcat5.x开始,GETPOST方法提交的信息,Tomcat采用了不同的方式来处理编码,对于POST请求,Tomcat会仍然使用request.setCharacterEncoding方法所设置的编码来处理,如果未设置,则使用默认的iso-8859-1编码。而GET请求则不同,Tomcat对于GET请求并不会考虑使用request.setCharacterEncoding方法设置的编码,而会永远使用iso-8859-1编码。

解决办法如下:

Ø 1.配置tomcat的配置文件server.xml里这句:
<Connector URIEncoding="GB2312" 
port="8080" maxHttpHeaderSize="8192"
maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
enableLookups="false" redirectPort="8443" acceptCount="100"
connectionTimeout="20000" disableUploadTimeout="true" />

加上这句:URIEncoding="GB2312"

Ø 2.使用String name=new String(request.getParameter("name").getBytes("ISO-8859-1"),"GB2312");转化编码

推荐使用第二种方式。


过滤器配置

 

 

 

如果是url的get提交参数带中文的 
可以改下面这个文件,加入一个URIEncoding="GBK" 
X:\Tomcat 5.5\conf\Server.xml 

Xml代码 

 

jsp头文件

Html代码 

<%@ page contentType="text/html;charset=gbk"%> //此处的charset的值要和web.xml里的 <param-value></param-value>值一样 

<%@ page contentType="text/html;charset=gbk"%>   //此处的charset的值要和web.xml里的  <param-value></param-value>值一样

单个类的乱码可以这样来解决:

tempStr = new String(str.getBytes("iso-8859-1"),"gb2312");


结尾的话:

request.setCharacterEncoding(charset); 必须写在第一次使用request.getParameter()之前,这样才能保证参数是按照已经设置的字符编码来获取。
response.setCharacterEncoding(charset);必须写在PrintWriter out = request.getWriter()之前,这样才能保证out按照已经设置的字符编码来进行字符输出。

通过过滤器,我们可以保证在ServletJSP执行之前就设置好了请求和响应的字符编码。

但是这样并不能完全解决中文乱码问题:


对于post请求,无论是获取参数环节还是输出环节"都是没问题的;

对于get请求,"输出环节"没有问题,但是"获取参数环节"依然出现中文乱码,所以在输出时直接将乱码输出了。

原因是post请求和get请求存放参数位置是不同的:


post方式参数存放在请求数据包的消息体中。get方式参数存放在请求数据包的请求行的URI字段中,以?开始以param=value¶me2=value2的形式附加在URI字段之后。而request.setCharacterEncoding(charset); 只对消息体中的数据起作用,对于URI字段中的参数不起作用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值