CenturyMagus的专栏

www.err123.cn ,收集各类编程错误的解决方案,欢迎大家访问

用户操作
[即时聊天] [发私信] [加为好友]
magusID:CenturyMagus
62971次访问,排名1684好友2人,关注者3
CenturyMagus的文章
原创 42 篇
翻译 1 篇
转载 40 篇
评论 23 篇
CenturyMagus的公告

ah011一起在友播听歌吧!
最近评论
zhengyuanting:通过URL传中文,如果不是post的话,是会乱码的
qq386232894:好文章!!!!
fz04003:谢谢啊,我终于搞懂这个东西了。
虽然我用的是JQuery,但是终于搞懂Struts这块是怎么回事了,谢谢!
小脚:终于全部搞懂了!!!谢谢老大~
小小鸟:好文章.比其他好多地方都讲的清楚透彻.赞一个.
文章分类
收藏
    相册
    编程网站
    Apache
    IBM DeveloperWorks
    onjava
    W3C
    编程错误解决方案收集
    计算机词汇在线词典
    存档
    订阅我的博客
    XML聚合  FeedSky
    订阅到鲜果
    订阅到Google
    订阅到抓虾
    订阅到BlogLines
    订阅到Yahoo
    订阅到GouGou
    订阅到飞鸽
    订阅到Rojo
    订阅到newsgator
    订阅到netvibes

    转载 JSP页面乱码分析及解决收藏

    新一篇: eclipse 乱码解决办法 | 旧一篇: Ant 条件判断 condition

    一。 解决响应中的乱码

    所谓响应中的乱码,就是显示页面上的乱码,因为页面数据是从服务器一端放入响应(response)中,然后发送给浏览器,如果响应中的数据无法被正常解析,就会出现乱码问题。

     

    为什么英文就没有问题呢?因为在iso-8859-1,gb2312, utf-8以及任意一种编码格式下,英文编码格式都是一样的,每个字符占8位,而中文就麻烦了,在gb2312下一个中文占16位,两字节,而在utf-8下一个中文要占24位,三字节。浏览器在不知道确定编码方式的情况下,就会把这些字符从中间截断,再显示的时候就乱掉了。所以,想要解决乱码问题,就是要告诉浏览器我们到底使用了什么样的编码方式。

     

    为了获得正常显示的中文,需要注意以下几步:

    1. 因为服务器要先从本地读取jsp文件,然后经过处理后写入响应,所以我们首先要知道的就是jsp文件的编码格式。从问题的源头着手解决。

      在咱们用的windowxp下,文件默认的编码格式是gb2312。

    2. 我们要在http的响应(response)中添加编码信息,使用如下方式:

      <%@ page contentType="text/html; charset=gb2312"%>

      这段要放在jsp页面的第一行,用来指定响应的类型和编码格式,contentType为text/html就是html内容,charset表示编码为gb2312。这样浏览器就可以从响应中获得编码格式了。
      这种<%@ %>的形式叫做jsp指令(directive),现在接触到的是page指令,还有include和taglib指令,我们会在后面陆续讲到。

    3. 还需要在html中指定编码格式。
      <head>
          <meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
          <title>title</title>
      </head>

      meta部分用来指定当前html的编码格式,注意这一段要放在head标签中,并且放到head标签的最前面,如果不是最前面ie下可能会出现问题,尤其是在title中有中文的情况下。
       

    二。POST乱码

    先把form里加上method="POST",让form提交的时候使用POST方式。

    发送请求的时候,使用的编码是iso-8859-1,意味着只有英文是有效字符,这个限制是因为当初指定http标准的成员都来自英语国家,所以如果使用默认的方式从请求获取数据,中文一定会全部变成乱码。

     

    解决方法是要在jsp最前面加上一条java语句,设置请求的字符编码。

    <%
        request.setCharacterEncoding("gb2312");
    %>

    三。GET乱码

    直接点击超链接,form的默认提交方式都是GET。

    POST方式下的解决方式还算简单,因为POST方式下提交的数据都是以二进制的方式附加在http请求的body部分发送,只需要在后台指定编码格式就足矣解决。

    GET方式下会将参数直接附加到url后面,这部分参数无法使用request.setCharacterEncoding()处理,结果就是get形式的所有中文都变成了乱码。

    这时再也没有简便方法了,只能对这些中文一个一个进行转换,使用new String(bytes, "gb2312")进行转码。

    <%
        String username = request.getParameter("username");
        byte[] bytes = username.getBytes("iso-8859-1");
        String result = new String(bytes, "gb2312");
        out.print(result);
    %>
    

     

    如我们所见,先从request中获得参数,接着把字符串按照iso-8859-1编码打散成byte数组,然后用gb2312编码组合成新字符串,最后打印出来就是正常的中文了。

    写在一起就变成了:

    <%=new String(new String(request.getParameter("username").getBytes("iso-8859-1"), "gb2312")%>
    

     

    这样做的缺点,是从请求中取得的所有中文都需要转码,非常烦琐。

    所以大家千万不要像这样<a href="test.jsp?username=测试">测试</a>,把中文参数写到超链接中,form尽量使用method="POST",这样只需要设置request.setCharacterEncoding()就可以应付中文乱码问题。

    发表于 @ 2008年07月23日 16:09:00|评论(loading...)|编辑|收藏

    新一篇: eclipse 乱码解决办法 | 旧一篇: Ant 条件判断 condition

    评论:没有评论。

    发表评论  


    登录
    Csdn Blog version 3.1a
    Copyright © CenturyMagus