linux系统字符集影响TOMCAT运行,造成页面HTML代码输出不全

OS:REDHAT LINUX AS4
TOMCAT:5.5.3
JDK:1.5.0_12
  随着网站访问量的加大,一个奇怪的现象引起我的注意。某些页面下部的文字或者按钮没有显示,有时候页面中会显示出一些HTML标签。这种情况并不是每次都出现,在访问量比较大的时候可能性大一些。查看页面代码发现HTML代码在某个位置被截断了,后面的都没有输出?!于是写在未输出部分里的文字或者按钮自然不能显示,而一些标记因为缺少对应的结束标记,所以被显示出来。
  这个问题我觉得很诡异。作为TOMCAT这么一个长期发展项目,出现这种情况而没人发现是不应该的。但是用GOOGLE查遍中文、英文站点,都没有找到合理的解释。一般都是说因为程序出错,所以JSP页面不能完全输出。但是在TOMCAT的日志里没有任何异常。
  为了能稳定的重现这种问题,我找到一个根本不用动态输出的页面(也是JSP)来研究,发现如果使用80端口访问,经由APACHE转给TOMCAT处理,输出的页面完整;如果使用8080端口直接提交给TOMCAT,输出的HTML就不全;如果将页面内的JAVA代码全部去掉,只保留<%@ page language="java"%>,则页面显示乱码,HTML输出完全,且可以通过修改浏览器编码的方式显示出正常的中文。
  通过这些现象,我判断应该是TOMCAT的问题,而且和编码方式有关系。我们知道JSP页面上的 pageEncodingcontentTypecharset 是指定不同的编码方式,前者指定JSP在被编译时使用的编码,后者指定JSP被输出时使用的编码。因为开发都在WINDOWS上做的,所以JSP文件的编码都是GB2312,指定pageEncoding=GB2312或者pageEncoding=GBK 应该都没问题,但只要一加上就会输出不全,页面被截断。我因此怀疑TOMCAT和JVM不能完全协调,很可能就是在对中文的编码方面。比如JVM便宜JSP的时候根据指定的pageEncoding进行了编码,而TOMCAT则对JSP采用另一种编码,二者计算出来的页面字节数不同,TOMCAT按照自己计算的字节输出,结果没输出完就给截断了。当然这只是我的推测了,国外的人很少有遇到中文编码的情况,国内的资料又没有,就先提出这么个假设吧。
  然后我去研究TOMCAT的配置文件server.xml,里面说TOMCAT运行时使用的是与操作系统相同的字符集。我忽然想到这个LINUX不是我亲手装的,是让一个新手装的,本来想让新人练练手,后来发现他把LINUX的默认字符集设置成中文了。打开/etc/sysconfig/i18n查看:
[root@localhost ~]# vi /etc/sysconfig/i18n                                                           
                                                                                                                     
LANG="zh_CN.UTF-8"                                                                                        
SUPPORTED="zh_HK.UTF-8:zh_HK:zh:zh_CN.UTF-8:zh_CN:zh:en_US.UTF-8:en_US:en" 
SYSFONT="latarcyrheb-sun16"                                                                            
把LANG="zh_CN.UTF-8"改成LANG="en_US.UTF-8"
重起服务器之后再测试那JSP,发现80端口访问依然正常,但是8080访问的时候超级慢,而其他页面在访问量很大的时候也不出现页面显示不全的现象了。
  老问题解决了,新问题出现了,实在是很让人诧异。为什么TOMCAT会出这种问题呢?也许是我用的版本不好,5.5.3有些低了,以后用高版本或者用6.x试试。如果还出这种问题,也给写个BUG REPORT吧。让TOMCAT项目组重视一下中文问题!
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值