JSP中文编码经验小结

影响JSP编码的两个属性:contentType 和 pageEncoding ;

首先,我们先了解一下JSP的编码规则,从中可以理解到contentType和pageEncoding的作用域.
contentType的charset是指服务器发送给客户端时的内容编码.而pageEncoding是jsp文件本身的编码. 
 JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
         第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
        第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
        JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
        第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的設定.
         pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。

从此我们可以看出,  pageEncoding影响的是JSP编绎成.java文件(即servlet文件)阶段 ,此时如果pageEncoding设定错了,用一般的编绎器编绎出来的.java文件中就会出现中文乱码. 而用eclipse的话会提示你编码错误..
contentType影响的是最后一个阶段,即由Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码(也就是.class文件)的阶段 ,我们在客户端看到的结果就是此阶段产生的,  这时的编码就是根据contentType来设定. 光从客户端来说,pageEncoding 和contentType设置的不一样,例pageEncoding=GB2312,contentType的charset=UTF-8,此时客户端显示的JSP页面都能够正常显示中文乱码. 

但是更重要的是与服务器的交互 ...   当从一个JSP页面发送请求至服务器端时, header中会发送什么数据呢?
header中发送的编码设定是由contentType指定的 ..  此时如果contentType指定的编码与服务器的编码不一致时,在服务器端就会产生中文乱码!

 

这是我经过多次实验得出的结果-_-|||  希望大家不会再为JSP的中文乱码问题头痛.. (统一编码为UTF-8是王道)

在开发J2EE WEB应用时最好使用过滤器来杜绝中文乱码的问题.  附过滤器源码:

 

  1. import  java.io.IOException;
  2. import  javax.servlet.Filter;
  3. import  javax.servlet.FilterChain;
  4. import  javax.servlet.FilterConfig;
  5. import  javax.servlet.ServletException;
  6. import  javax.servlet.ServletRequest;
  7. import  javax.servlet.ServletResponse;
  8. public   class  SetCharacterEncodingFilter  implements  Filter {
  9.   private  String encoding;
  10.   public   void  init(FilterConfig filterConfig)  throws  ServletException {
  11.    // TODO Auto-generated method stub
  12.    this .encoding=filterConfig.getInitParameter( "encoding" );
  13.  }
  14.   public   void  doFilter(ServletRequest request, ServletResponse response,
  15.    FilterChain chain)  throws  IOException, ServletException {
  16.    // TODO Auto-generated method stub
  17.   request.setCharacterEncoding( this .encoding);
  18.   chain.doFilter(request,response);
  19.  }
  20.   public   void  destroy() {
  21.    // TODO Auto-generated method stub
  22.  }
  23. }

 

在web.xml中添加以下代码:

  1. < filter >
  2.     < filter-name > SetCharacterEncodingFilter </ filter-name >
  3.     < filter-class > org.hilor.servlet.SetCharacterEncodingFilter </ filter-class >
  4.     < init-param >
  5.      < param-name > encoding </ param-name >
  6.      < param-value > UTF-8 </ param-value >
  7.     </ init-param >
  8.    </ filter >
  9.     < filter-mapping >
  10.     < filter-name > SetCharacterEncodingFilter </ filter-name >
  11.     < url-pattern > /* </ url-pattern >   
  12.    </ filter-mapping >

这样在所有的request请求的时候就会转换成UTF-8编码.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值