程序从tomcat迁移至websphere的修改


从编码(乱码)问题角度看 Tomcat 和 Websphere的区别。

(一)
源引自:http://www.51tarena.com/html/2009/5/785.htm (Struts中文乱码问题)

JSP的中文乱码问题,其根源在于:Web容器(Tomcat)默认的字符处理编码是iso-8859-1,对于需要在浏览器页面上显示中文的JSP程序,
但在程序中并没有指定中文的字符集,那么中文将在浏览器页面上显示为乱码。当然,前面所说的是指在Tomcat服务器下的,其他服务
器有些不是这样的,比如BEA Weblogic和IBM Websphere是从操作系统中取得默认的编码,然后按该编码来转码所有用户请求.Struts中
文问题有三种:发送请求时的中文问题、处理响应结果的中文问题和国际化资源文件的中文问题。


1. 发送请求时的中文问题

客户机向服务器发送请求时,根据所使用浏览器的不同可能会有不同的编码形式。不过通常情况下在请求到达Web容器前要将之转码,
转成某种固定的编码以方便Web应用的处理。这种问题有三种处理方法:

    第一种(针对Tomcat 5 对POST请求有效,GET请求无效,因为Tomcat 5 对POST和GET请求时分别处理的)可以采用设置用户请求对象的编码形式,也就是以HttpServletRequest对象的编码的形式来进行用户请求的转码:

//将用户请求转码为GB2312、GB18030、GBK、UTF-8 等型,具体转为什么类型的编码以您的jsp文件的编码方式为准,java、jsp 、js 、css应保持一致的编码方式。这里以GBK为例。

request.setCharacterEncoding("GBK");

    第二种(对GET请求有效),可以在Servlet中对用户输入的数据进行转码。Web容器接受到一个请求时,它会将它发往某个处理的Servlet。在Servlet中直接获取用户请求的数据,然后将之转码为需要的格式,例如把数据转换为GBK格式:

String username = request.getParameter("username");

username = new String(username.getBytes("iso-8859-1”), "GBK");

    以上两种方法都是很常用的,但第一种是每个页面都要去修改,当JSP页面很多时比较麻烦,第二种就每个发送的数据都要转码,也很麻烦。

    第三种,就是采用Filter过滤器方式,将用户的所有请求都通过过滤器进行转码,这种方法就克服了以上两种方法的缺点。代码如下:

public void doFilter(ServletRequest request, ServletResponse response,                 

 FilterChain chain ) throws IOException, ServletException {

              request.setCharacterEncoding("GBK");
              //response.setContentType("text/html;charset=GBK");

              chain.doFilter(request, response);

       }

这里转码为GBK过滤器的主要代码,当然还要把这个类要在web.xml文件中部署。


2. 处理响应结果的中文问题

响应的结果包括Servlet、JSP和HTML三种情况,可以通过以下方式设置响应结果编码:

对于Servlet,可以在Servlet中为其设置响应代码类型,代码如下:
response.setContentType("text/html;charset=GBK"); 也可把这句加到上面的Filter中,如注释掉的部分。
有人说用 response.setCharacterEncoding("GBK"); 无效,必须用 response.setContentType("text/html;charset=GBK"); 本人没试过。

对于JSP,是比较方便的,只需要在JSP最前部分按如下方式声明:

<%@ page contentType="text/html;charset=GBK"%>

对于HTML,其和JSP文件基本类似,也是在页面最前部分按如下方式声明:

<head>
       <META HTP-EQUIV="contentType" CONTENT="text/html;charset=GBK">
</head>


3.  国际化资源文件的中文问题

一个Struts应用程序中,可以配置多个资源包,无论是Action、ActionForm还是JSP都可以访问这些包中的资源。资源包就是由扩展名为.properties的文件组成的一组具有相同前缀的文件,如ApplicationResources_zh_CN.properties、ApplicationResources_zh.properties和ApplicationResources.properties。这些文件就构成一个Struts的资源包,它们都有一个统一的前缀ApplicationResources,凡是有相同前缀的资源文件就都属于一个包。

当用MyEclipse编写资源文件时,默认是不能保存中文的,因为默认保存编码的格式是ISO-8859-1,这就需要修改为gb2312或者gbk编码格式。Windons -->Preferences-->General -->Content Types-->Text-->Java Properties File,在最下方把其Default encoding改为"UTF-8”,然后"update”就可以保存中文了。但就这样保存的中文还是不能够在页面上使用的,因为Web容器默认是使用ISO-8859-1,也就会把中文用ISO-8859-1的格式发送给客户页面,显示的还是乱码,这就是JAVA国际化的问题。JAVA是支持unicode编码格式的,unicode是国际统一通用编码,所以不管什么格式的编码转化为unicode编码肯定不会显示乱码的。这个时候就是需要把资源文件的UTG-8编码格式转化为unicode编码格式,而SUN公司又提供了这样的一种工具。在JDK的安装目录bin下,有一个叫native2ascii可执行文件,这个是专门来进行资源文件转码的。打开cmd,进入JDK的bin目录下,把资源文件拷贝到该目录下,执行该命令。比如:
native2ascii –encoding GBK ApplicationResources.properties ApplicationResources_zh_CN.properties 就是把GBK编码格式ApplicationResources.properties转化为unicode编码格式ApplicationResources_zh_CN.properties,这样显示页面时就不会出现乱码了。

(二)Websphere 默认的字符处理编码要看 :管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->
进程定义--->java虚拟机--->通用jvm参数 的设置了,如为,-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 则是GBK。
我们可以通过如下判定:

 用ieHTTPHEADERS 等工具查看POST请求中的请求参数,汉字是经过Encoding的(是按哪种字符集编码要看jsp文件的编码方式了),
 由 % 间隔的十六进制数组成,如下 jsp文件的字符集是UTF-8,form 表单提交,用ieHTTPHEADERS 工具查得请求参数为:
 struts.token.name=struts.token&struts.token=HPADE1CXRJ0PASL2V7RQFVXJLLFB1OUE&ptoId=244&
 orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0&orgId=&oscId=&oscType=H1&ptoType=01&impDate=2009-06-16
 &details=%E5%85%B7%E4%BD%93%E6%83%85%E5%86%B5
 
 orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0 经UTF-8 编码的,其中文对应的是"组织名称" ,E7BB84 是"组"的十六进制表示,
 E7BB87 是"织"的十六进制表示等。
 
 form表提交后,在ACTION中查看 "组织名称" 变为乱码: "缁勭粐鍚嶇О"
 
 通过以下代码分析:
 
  String JinZhi16 = Integer.valueOf("E7",16).toString();  // 把E7 转为十进制,这里JinZhi16 = 231 ,BB 对应的十进制:187
  System.out.println("JinZhi16 = "+JinZhi16);
  
  // 这里的231、187,132等都是通过Integer.valueOf("E7",16).toString()分别把对应的E7、BB、84 等转过来的十进制数字。
  byte[] bt = new byte[]{(byte)231,(byte)187,(byte)132,(byte)231,(byte)187,(byte)135,(byte)229,(byte)144,(byte)141,(byte)231,(byte)167,(byte)176};
  
  System.out.println("GB18030 = "+new String(bt,"GB18030"));
  System.out.println("GBK = "+new String(bt,"GBK"));
  
  System.out.println("UTF-8 = "+new String(bt,"UTF-8"));
  
  String aa = new String(bt,"GB18030");
  System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8"));
  
  String encoding=System.getProperty("file.encoding");

  System.out.println("Default System Encoding: " + encoding);
  
  输出内容:
   JinZhi16 = 231
   GB18030 = 缁勭粐鍚嶇О
   GBK = 缁勭粐鍚嶇О
   UTF-8 = 组织名称
   GBK = 组织名称
   Default System Encoding: UTF-8
   
  我们发现:form表单提交 orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0(即"组织名称") 到 ACTION ,是 "缁勭粐鍚嶇О"
这样的乱码,而 System.out.println("GB18030 = "+new String(bt,"GB18030"));  输出的也为"缁勭粐鍚嶇О" ,所以可假设其
编码字符集也为GB18030或GBK,用通过System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8")); 得知确为GBK或
GB18030。GB18030是 GBK的超集,他支持3--4字节的编码,不过这两个标准都支持GB2312-80 。
   
  查看WebSphere的 "通用jvm参数" 的设置了是 -Dfile.encoding=GB2312 -Dclient.encoding.override=GBK
  所以最后把-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 改为
  -Dfile.encoding=UTF-8 -Dclient.encoding.override=UTF-8 就可以解决乱码了(对get 和 post 有效)。
  
  修改完上述参数要从起WebSphere的服务,远程登录到安装WebSphere的机器上,你的was发布的ip 就是WebSphere所在的机器,
  其用户名和密码同登录到发布was 的WebSphere的控制台一样,因为本来就是同一台机器。登录到WebSphere控制台 ,服务器
    ——>应用程序服务器 找到对应的节点名称如 "cncaitKaifaNode03" ,在控制面板 - > 服务 -> 查看以IBM开头的有"cncaitKaifaNode03"
    标识的WebSphere服务,重启。
   
    用如下过滤器不管用。
   
public class  ChartFilter  implements  Filter{
 private   String   encoding   =   "UTF-8";  
   
    public   void   init(FilterConfig   config)   throws   javax.servlet.ServletException   {  
        String   temp   =   config.getInitParameter("encoding");  
        encoding   =   (temp   ==   null)   ?   encoding   :   temp;  
    }  
 
    public   void   doFilter(ServletRequest   request,  
           ServletResponse   response,  
                             FilterChain   chain )   throws   java.io.IOException,   javax.servlet.ServletException   {  
        System.out.println("-----------过滤器-----------encoding = "+encoding);
     request.setCharacterEncoding(encoding); 
     response.setCharacterEncoding(encoding);
     response.setContentType("text/html; charset="+encoding);
        chain.doFilter(request,   response);  
    }  
    public   void   destroy()   {  
    }  
}
 
 
(三)共同问题:
Tomcat 5  和 webSphere6.1 对get请求,如果有奇数个汉字的参数,则紧接着&的下一参数会追加在这个汉字参数后。如:
String url = "/cnca/servlet/update.action?orgName=中国船级社质量认证公司&oscYM=2009-06" ,则取得orgName的值
为中国船级社质量认证公oscYM=2009-06,而oscYM 没有取到值。
 解决的简单方法就是在 orgName=中国船级社质量认证公司之后 &oscYM=2009-06之前加一个全角空格。

---------------------------------------------------------------


程序从tomcat迁移至websphere的修改

 1.普通应用部署在websphere上中文乱码问题
 
 解决:管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->将通用jvm参数设置为:
 根据你的jsp java文件的编码是什么而定,如果是UTF-8 则设置为 -Ddefault.client.encoding=UTF-8 -Dclient.encoding.override=UTF-8 -Dfile.encoding=UTF-8 -Duser.language=zh -Duser.region=CN
 
 2.修改hibernate.cfg.xml (针对我的项目cnca(自律))
 <property name="connection.datasource">jdbc/cncaprod</property>
 
 以下下是网上搜集的:
 在部署文件中设定了jdbc引用名jdbc/sample,jndi名字为jdbc/sample
 如果采用如下代码:
 javax.sql.DataSource ds = (javax.sql.DataSource)ctx.lookup("java:comp/env/jdbc/sample");
 conn = ds.getConnection();
 
 运行就报错:05-7-1 10:02:24:178 CST] 00000031 SystemErr R Naming-Exception: Exception occurred while the JNDI NamingManager was processing a javax.naming.Reference object.
 
 去掉"java:comp/env/”就好了。
 
 解决:确认部署后在概要表空间下的config/cells/CN7642012HNode01Cell/applications目录下相应应用的web.xml文件下有正确的配置JNDI,如:
 <b><resource-ref id="ResourceRef_1097466019938"></b>
 <res-ref-name>jdbc/yjjndi</res-ref-name>
 <res-type>javax.sql.DataSource</res-type>
 <res-auth>Container</res-auth>
 <res-sharing-scope>Shareable</res-sharing-scope>
 </resource-ref>
 再查看同目录下的ibm-web-bnd.xmi文件中id是否和上面的id相同,如下(注意粗体部分):
<b><resRefBindings xmi:id="ResourceRefBinding_1097466019938" jndiName="jdbc/yjjndi" loginConfigurationName="DefaultPrincipalMapping">
<bindingResourceRef href="WEB-INF/web.xml#ResourceRef_1097466019938"/></b>
<properties xmi:id="Property_1165956970219" name="com.ibm.mapping.authDataAlias" value="CN7642012HNode01/yjj2c" description="description"/>
</resRefBindings>
 
 3. 对get请求,去掉类似new String(username.getBytes("iso-8859-1”), "GBK"); 的代码段。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值