解决web服务器各种应用的乱码问题(转)

http://www.chinaunix.net/jh/13/381406.html

乱码问题:

(1)服务器端: 
修改httpd.conf (在Redhat中放置的位置为/etc/httpd/conf/) 
查找: 
AddDefaultCharset ISO-8859-1 
改成: 
#AddDefaultCharset ISO-8859-1 


AddDefaultCharset off 
]

这种方式关掉了服务器的默认语言的发送,这样仅凭html文件头中设置的语言来决定网页语言。 

很多文章都说通过修改为 AddDefaultCharset GB2312 把缺省语言改成GB2312来解决中文乱码,确实GB2312内码的网页可以正常显示了,但这并非万全之策。因为当你的网页内码不是GB2312,就算你在网页用下面的meta指定了正确的语言,如ISO8859-1,也不会解码为ISO8859-1,因为Apache已经先你一步将GB2312指定为网页的语言了,


(2)养成良好的习惯,在每个网页的<head>;</head>;的最前面加入这行: 

    
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">; 


  一般的中文版网页编辑工具(例如FrontPage、Dreamweaver等)都会自动加上这行。 

3、如何解决中文文件名无法访问 

 
 在ie中选择 工具 ->; internet选项 ->; 高级 ->; 取消“总是以UTF-8发送URL”。 




UTF-8网页空白,在网页中加上metadata标识后,还需要手动调整编码為 utf-8 才能正常显示

如果使用的是Mozilla、Mozilla Firefox、Sarafi等其他目前流行的浏览器,通常就不会有这样的问题。

在网页的meta中指定用UTF-8:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />; 


在<head>;</head>;之前,把"Content-Type"放在最前面,便可以解決这样的问题了。 

原因:

IE 解析网页编码时是 HTML 內的标识优先的,然后是 HTTP header ;而mozilla 系列的浏览器刚刚好相反。

一般情况在,很多人是把<title>;</title>;排在最前面,并且在title中就出现了UTF-8中文,这样,IE在解析时,就先遇到UTF-8,不往下解析了,因此必须把如果把meta放在UTF-8出现之前,这样IE才能判断这个网页是以UTF-8编码的。 


总之:
无论是 PHP、JSP、ASP 或其他动态网页的脚本语言,如果需要作编码设定,最好放在最前面。

使用php,也可以定义php的默认语言. 

php.ini中: 

default_charset = "gb2312" 


释掉此行,做了以上修改,一样是为了让浏览器根据网页头中的charset来自动选择语言,这样就可以在同台服务器上提供多种语言的网页服务。


java中文乱码的解决 


 
 
在基于JAVA的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。
这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码,故会出现此问题。

1、在网页中输出中文。

JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如:
String  str="中文";
str=new  String(str.getBytes("GB2312"),"8859_1");
但如果在编译程序时,使用的编码是“GB2312”,且在中文平台上运行此程序,不会出现此问题,一定要注意。

2、从参数中读取中文

这正好与在网页中输出相反如:
str=new  String(str.getBytes("8859_1"),"GB2312");

3、操作DB中的中文问题

一个较简单的方法是:在“控制面扳”中,把“区域”设置为“英语(美国)”。如果还会出现乱码,还可进行如下设置:
取中文时:str=new  String(str.getBytes("GB2312"));
向DB中输入中文:str=new  String(str.getBytes("ISO-8859-1"));

4、在JSP中的中文解决:

在“控制面扳”中,把“区域”设置为“英语(美国)”.
在JSP页面中加入:
如果还不行正常显示,则还要进行下面的转换:
如:name=new  String(name.getBytes("ISO-8859-1"),"GBK");
就不会出现中文问题了。

CGI的?不知道对不?

找到CGI.pm,打开它,找到$self->;charset('ISO-8859-1');将它改为$self->;charset('GB2312');



 wingger 回复于:2004-10-10 11:03:56

UP


 haohaoo 回复于:2004-10-11 11:59:47

MM施主,俺崇拜你了


 wingger 回复于:2004-10-12 11:50:30

补充:
如果使用php,也可以定义php的默认语言. 

php.ini中: 

;default_charset = "gb2312" 

注意这里是注释掉此行,做了以上修改,目的是为让浏览器根据网页头中的charset来自动选择语言,这样就可以在同台服务器上提供多种语言的网页服务。


 wingger 回复于:2004-10-12 12:31:33

java中文乱码的解决 


 
 
在基于JAVA的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。
这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码,故会出现此问题。

1、在网页中输出中文。

JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如:
String  str="中文";
str=new  String(str.getBytes("GB2312"),"8859_1");
但如果在编译程序时,使用的编码是“GB2312”,且在中文平台上运行此程序,不会出现此问题,一定要注意。

2、从参数中读取中文

这正好与在网页中输出相反如:
str=new  String(str.getBytes("8859_1"),"GB2312");

3、操作DB中的中文问题

一个较简单的方法是:在“控制面扳”中,把“区域”设置为“英语(美国)”。如果还会出现乱码,还可进行如下设置:
取中文时:str=new  String(str.getBytes("GB2312"));
向DB中输入中文:str=new  String(str.getBytes("ISO-8859-1"));

4、在JSP中的中文解决:

在“控制面扳”中,把“区域”设置为“英语(美国)”.
在JSP页面中加入:
如果还不行正常显示,则还要进行下面的转换:
如:name=new  String(name.getBytes("ISO-8859-1"),"GBK");
就不会出现中文问题了。


 level 回复于:2004-10-12 12:39:34

:em02:


 wingger 回复于:2004-10-12 12:49:43

CGI的应该是这个:

找到CGI.pm,找到$self->;charset('ISO-8859-1');将它改为$self->;charset('GB2312');

或按以上同样处理,应该可以


 wingger 回复于:2004-10-31 14:59:03

彻底解决Tomcat 5.0.19中文乱码

  一、Include的页面乱码

  现象:include进来的页面出现乱码,其它页面正常。

  原因:Tomcat在缺省情况下使用ISO-8859-1编码,但是在include时有时Tomcat不能正确根据外层.jsp文件的编码解析include进来的文件,造成include进来的文件中的中文乱码。

  解决:这儿可以有很多解决办法,但是对于我们的中文环境,从根本上的解决办法是将Tomcat 5.0.19的核心缺省编码从ISO-8859-1修改为GBK 。

  
  二、提交的数据乱码

  现象:通过表单提交的数据出现乱码。

  原因:原因未明。可能是Tomcat在接收到请求后,并没有能够根据request中的信息提前正确的编码方式。

  解决:可以添加一个设置字符集的Filter。

package filters;


import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.UnavailableException;

public class SetCharacterEncodingFilter implements Filter {
 protected String encoding = null;
 protected FilterConfig filterConfig = null;
 protected boolean ignore = true;

 public void destroy() {
  this.encoding = null;
  this.filterConfig = null;
 }

public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)
throws IOException, ServletException {

 // Conditionally select and set the character encoding to be used
 if (ignore || (request.getCharacterEncoding() == null)) {
  String encoding = selectEncoding(request);
  if (encoding != null)
   request.setCharacterEncoding(encoding);
 }

 // Pass control on to the next filter
 chain.doFilter(request, response);

}

public void init(FilterConfig filterConfig) throws ServletException {

 this.filterConfig = filterConfig;
 this.encoding = filterConfig.getInitParameter("encoding");
 String value = filterConfig.getInitParameter("ignore");
 if (value == null)
  this.ignore = true;
 else if (value.equalsIgnoreCase("true"))
  this.ignore = true;
 else if (value.equalsIgnoreCase("yes"))
  this.ignore = true;
 else
  this.ignore = false;

}

protected String selectEncoding(ServletRequest request) {
 return (this.encoding);
}

  

配置web.xml

<filter>

 <filter-name>Set Character Encoding</filter-name>
 <filter-class>filters.SetCharacterEncodingFilter</filter-class>
 <init-param>
  <param-name>encoding</param-name>
  <param-value>GBK</param-value>
 </init-param>
</filter>

<filter-mapping>
 <filter-name>Set Character Encoding</filter-name>
 <url-pattern>/*</url-pattern>
</filter-mapping>




 wingger 回复于:2004-10-31 15:05:12

没试过不知道行不行

java Servlet 中文乱码问题

import java.io.*;

import java.util.*;
import javax.servlet.*;
import javax.servlet.http.*;

public class GetFormData extends HttpServlet
{
    public void doGet(HttpServletRequest request,HttpServletResponse response) throws ServletException,IOException
    {
        String paramValues;
        paramValues=request.getParameter("UserName";
        response.setContentType("text/html;charset=gb2312";
        PrintWriter out=response.getWriter();
        out.println("<html>;<title>;test</title>;<body>;";
        out.println("以下是收到的数据<br>;";
        out.println("UserName="+paramValues);
        out.println("<br>;接收结束";
        out.println("</body>;";
    }
    public void doPost(HttpServletRequest request,HttpServletResponse response) throws ServletException,IOException
    {
        doGet(request,response);
    }

}


只需要把 

paramValues=request.getParameterValues("UserName"改成下面的就可以了

paramValues=request.getParameter("UserName";


当然这句是必須的 response.setContentType("text/html;charset=gb2312"


 在jsdk2.1 tomcat及Domino5.8上的Servlet引擎运行通过了


 wingger 回复于:2004-10-31 15:09:55

Weblogic Server中如何解决中文显示乱码问题 
《世界计算机》IT.ICXO.COM ( 日期:2004-09-29 16:07) 


--------------------------------------------------------------------------------
 
 
由于操作系统、浏览器、数据库、JVM采用的字符集都不一样,基于Weblogic Server开发的应用经常出现中文显示乱码问题,其实在Weblogic Server上运行的WEB应用有很多与字符集有关的设置,下面做一个总结,为了正确处理中文,最好把这些设置都设上。


1. 在JSP文件头加入
<%@ page contentType=text/html; charset=GBK %>; 
指定该JSP采用的字符集。



2.在Weblogic.xml文件的中加入:

引用:encoding
GBK



指定JSP文件中采用的字符集,在JSP文件中的<%@ page contentType=text/html; charset=GBK %>;会覆盖该设置



3.在Weblogic.xml文件的中加入

compilerSupportsEncoding

true


如果为TRUE,指定在编译JSP文件时,采用在JSP文件中定义的
<%@ page contentType=text/html; charset=GBK %>;或中定义的encoding参数中定义的字符集进行编码,如果为FALSE,则采用JVM中默认指定的字符集进行编码。



4. Weblogic Server需要把HTTP request(GET 和POST)中的数据从它的原始编码转化为Unicode,以便Java servlet API进行处理,为了做这种转换,Weblogic Server需要知道HPPT request中的数据的编码方式。这可以通过在Weblogic.xml的中设置.
〈INPUT-charset>;

/
GBK




5.从ORACLE数据库中检索出来的中文显示不正确时,在这种情况下,如果数据库使用的是中文字符集,并使用的是Type 2 JDBC Driver时,可加入Weblogic.codeset=GBK的属性来解决这个问题。代码如下:

java.util.Properties props = new java.util.Properties();

props.put(Weblogic.codeset, GBK);
props.put(user, scott);
props.put(password, tiger);
String connectUrl = jdbc:Weblogic:oracle;
Driver myDriver = (Driver)
Class.forName(Weblogic.jdbc.oci.Driver).newInstance();
Connection conn = 
myDriver.connect(connectUrl, props);



6. 如果是采用WTC调用Tuxedo中的服务,在JSP页面中无法正确显示中文,必须使安装Tuxedo的服务器上的NLS_LANG环境变量与数据库中的字符集的设置一样。如后台Oracle数据库中的字符集设置为SIMPLIFIED CHINESE_CHINA.ZHS16GBK,那么Tuxedo应用服务器上的NLS_LANG环境变量应设置为:

export NLS_LANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK



 ccwwd 回复于:2004-11-22 14:39:26

崇拜你呀!


 hitty 回复于:2005-07-06 14:09:16

利害,加我吧....

PHP中文乱码好像可以用:
ini_set('default_charset','gb2312');
来解决,要比改配置文件要灵活一些....


 kot31 回复于:2005-11-26 09:40:18

刚来这个论坛,看到了楼主的宝文,冒昧的问一下,文章中的 :wink: 是干嘛用的? 

:wink:



 sipcom 回复于:2006-02-15 16:45:32

我使用perl5.6,linux环境,用于连接oracle9i

根据上面的提示将CGI.pm中的改为GB2312后,查询到的数据记录显示仍然为乱麻,中文无法显示,这是why?


 树和石头 回复于:2006-02-19 22:14:36

to sipcom:
在linux环境下不应该把字符集设为GB2312,而应该是iso-8859-1,详细请参考以下内容:(资料来源:http://www.javadict.com/zxxx/2005711170800.htm)

Java/J2EE中文问题终极解决之道

Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道。

  最古老的解决方案是使用String的字节码转换,这种方案问题是不方便,我们需要破坏对象封装性,进行字节码转换。

  还有一种方式是对J2EE容器进行编码设置,如果J2EE应用系统脱离该容器,则会发生乱码,而且指定容器配置不符合J2EE应用和容器分离的原则。

  在Java内部运算中,涉及到的所有字符串都会被转化为UTF-8编码来进行运算。那么,在被Java转化之前,字符串是什么样的字符集? Java总是根据操作系统的默认编码字符集来决定字符串的初始编码,而且Java系统的输入和输出的都是采取操作系统的默认编码。

  因此,如果能统一Java系统的输入、输出和操作系统3者的编码字符集合,将能够使Java系统正确处理和显示汉字。这是处理Java系统汉字的一个原则,但是在实际项目中,能够正确抓住和控制住Java系统的输入和输出部分是比较难的。J2EE中,由于涉及到外部浏览器和数据库等,所以中文问题乱码显得非常突出。

  J2EE应用程序是运行在J2EE容器中。在这个系统中,输入途径有很多种:一种是通过页面表单打包成请求(request)发往服务器的;第二种是通过数据库读入;还有第3种输入比较复杂,JSP在第一次运行时总是被编译成Servlet,JSP中常常包含中文字符,那么编译使用javac时,Java将根据默认的操作系统编码作为初始编码。除非特别指定,如在Jbuilder/eclipse中可以指定默认的字符集。

  输出途径也有几种:第一种是JSP页面的输出。由于JSP页面已经被编译成Servlet,那么在输出时,也将根据操作系统的默认编码来选择输出编码,除非指定输出编码方式;还有输出途径是数据库,将字符串输出到数据库。

  由此看来,一个J2EE系统的输入输出是非常复杂,而且是动态变化的,而Java是跨平台运行的,在实际编译和运行中,都可能涉及到不同的操作系统,如果任由Java自由根据操作系统来决定输入输出的编码字符集,这将不可控制地出现乱码。

  正是由于Java的跨平台特性,使得字符集问题必须由具体系统来统一解决,所以在一个Java应用系统中,解决中文乱码的根本办法是明确指定整个应用系统统一字符集。

  指定统一字符集时,到底是指定ISO8859_1 、GBK还是UTF-8呢? 

  (1)如统一指定为ISO8859_1,因为目前大多数软件都是西方人编制的,他们默认的字符集就是ISO8859_1,包括操作系统Linux和数据库MySQL等。这样,如果指定Jive统一编码为ISO8859_1,那么就有下面3个环节必须把握:

  开发和编译代码时指定字符集为ISO8859_1。

  运行操作系统的默认编码必须是ISO8859_1,如Linux。

  在JSP头部声明:<%@ page contentType="text/html;charset=ISO8859_1" %>。

  (2)如果统一指定为GBK中文字符集,上述3个环节同样需要做到,不同的是只能运行在默认编码为GBK的操作系统,如中文Windows。

  统一编码为ISO8859_1和GBK虽然带来编制代码的方便,但是各自只能在相应的操作系统上运行。但是也破坏了Java跨平台运行的优越性,只在一定范围内行得通。例如,为了使得GBK编码在linux上运行,设置Linux编码为GBK。

  那么有没有一种除了应用系统以外不需要进行任何附加设置的中文编码根本解决方案呢?

  将Java/J2EE系统的统一编码定义为UTF-8。UTF-8编码是一种兼容所有语言的编码方式,惟一比较麻烦的就是要找到应用系统的所有出入口,然后使用UTF-8去“结扎”它。

  一个J2EE应用系统需要做下列几步工作:

开发和编译代码时指定字符集为UTF-8。JBuilder和Eclipse都可以在项目属性中设置。 
使用过滤器,如果所有请求都经过一个Servlet控制分配器,那么使用Servlet的filter执行语句,将所有来自浏览器的请求(request)转换为UTF-8,因为浏览器发过来的请求包根据浏览器所在的操作系统编码,可能是各种形式编码。关键一句:
request.setCharacterEncoding("UTF-8")。
网上有此filter的源码,Jdon框架源码中com.jdon.util.SetCharacterEncodingFilter
需要配置web.xml 激活该Filter。 
在JSP头部声明:<%@ page contentType="text/html;charset= UTF-8" %>。 
在Jsp的html代码中,声明UTF-8:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 
设定数据库连接方式是UTF-8。例如连接MYSQL时配置URL如下:
jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8
一般数据库都可以通过管理设置设定UTF-8 
其他和外界交互时能够设定编码时就设定UTF-8,例如读取文件,操作XML等。 
     笔者以前在Jsp/Servlet时就采取这个原则,后来使用Struts、Tapestry、EJB、Hibernate、Jdon等框架时,从未被乱码困扰过,可以说适合各种架构。希望本方案供更多初学者分享,减少Java/J2EE的第一个拦路虎,也避免因为采取一些临时解决方案,导致中文问题一直出现在新的技术架构中。


 sipcom 回复于:2006-02-20 12:01:38

原来是iso-8859-1,但无法显示,在参考几个文档后,改为GB2312,但还是无法显示中文,我估计师apache的设定问题,但问题还没解决


 yzmxf 回复于:2006-02-20 20:50:37

太谢谢了 

今天就遇到了这个问题 明天去公司看看

不过应该可以解决  

谢谢法师斑竹 呵呵:em02::em02::em02:


 树和石头 回复于:2006-02-25 10:29:07

那我就不知道了,我用的是weblogic服务器,就是严格按照上面所说的步骤执行(少任何一个环节都不行)才能成功解决乱码问题的。

无能为力了。同情。。。这个问题确实很头疼,当时折腾了我一个多星期呢。
祝福你早日解决乱码问题!


 softiger 回复于:2006-02-27 09:53:26

也是web服务器乱码问题,百思不解,请高人指教,多谢啦1
Resin3.08在Linux As 3中一直运行正常,最近出现一个非常奇怪的问题,请各位朋友指点?

jsp从数据库取得记录后生成静态文件,如果Resin服务器启动时间不长,则生成文件没有乱码出现,一切正常;Resin跑一段时间后,生成的文件就出现了乱码,Resin重新启动后,重新生成文件又是正常的。

可以确定,java编码是正常的,为什么会跑一段时间后才出现乱码问题呢?查看日志也发现不了什么异常。


 sipcom 回复于:2006-03-01 15:49:50

我想把问题再清楚描述下:
我写了cgi动态页面,文件名test.pl
我用$perl test.pl
执行结果显示查询oracle数据库中文显示,但通过web方式http://xxxxxx/cgi-bin/test.pl下却显示数据库中的中文记录为???,静态页面中文显示正常,why?


 sipcom 回复于:2006-03-02 16:18:38

经过下午的摸索,问题终于解决了

在httpd.conf文件中增加了一下1行
    AddCharset    GB2312       .zhs16gbk
(.zhs16gbk跟用户环境下的nls_lang是一样的值)




原文链接:http://bbs.chinaunix.net/viewthread.php?tid=381406
转载请注明作者名及原文出处

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值