Java中文问题之解决方法,比较全

从csdn上一个id为chuan122345的网友的回答中粘贴过来的

转自:http://topic.csdn.net/t/20060517/11/4757694.html

自从接触Java和JSP以来,就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。   
    
  一、Java中文问题的由来   
    
  Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。   
    
  首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding   GBK或-ecoding   gb2312编译;对于JSP,在文件头加上<%@   page   contentType="text/html;charset=GBK"%>或<%@   page   contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码问题。   
    
  本文要重点讨论的是第二类乱码,即Java程序与其他存储媒介交互时产生的乱码。很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,具体情况如下:   
    
  从页面form提交数据到java程序   byte->char   
  从java程序到页面显示   char—>byte   
    
  从数据库到java程序   byte—>char   
  从java程序到数据库   char—>byte   
    
  从文件到java程序   byte->char   
  从java程序到文件   char->byte   
    
  从流到java程序   byte->char   
  从java程序到流   char->byte   
    
  如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码。   
    
  二、解决方法   
    
  前面已经提到了Java程序与其他媒介交互时字符和字节的转换过程,如果这些转换过程中容易产生乱码。解决这些乱码问题的关键在于确保转换时使用的编码方式与字节原有的编码方式保持一致,下面分别论述(Java或JSP自身产生的乱码请参看第一部分)。   
    
  1、JSP与页面参数之间的乱码   
  JSP获取页面参数时一般采用系统默认的编码方式,如果页面参数的编码类型和系统默认的编码类型不一致,很可能就会出现乱码。解决这类乱码问题的基本方法是在页面获取参数之前,强制指定request获取参数的编码方式:request.setCharacterEncoding("GBK")或request.setCharacterEncoding("gb2312")。   
  如果在JSP将变量输出到页面时出现了乱码,可以通过设置response.setContentType("text/html;charset=GBK")或response.setContentType("text/html;charset=gb2312")解决。   
  如果不想在每个文件里都写这样两句话,更简洁的办法是使用Servlet规范中的过虑器指定编码,过滤器的在web.xml中的典型配置和主要代码如下:   
  web.xml:   
    
  <filter>   
  <filter-name>CharacterEncodingFilter</filter-name>   
  <filter-class>net.vschool.web.CharacterEncodingFilter</filter-class>   
  <init-param>   
  <param-name>encoding</param-name>   
  <param-value>GBK</param-value>   
  </init-param>   
  </filter>   
  <filter-mapping>   
  <filter-name>CharacterEncodingFilter</filter-name>   
  <url-pattern>/*</url-pattern>   
  </filter-mapping>   
    
  CharacterEncodingFilter.java:   
    
  public   class   CharacterEncodingFilter   implements   Filter     
  {   
    
  protected   String   encoding   =   null;     
    
  public   void   init(FilterConfig   filterConfig)   throws   ServletException     
  {   
  this.encoding   =   filterConfig.getInitParameter("encoding");   
  }   
    
  public   void   doFilter(ServletRequest   request,   ServletResponse   response,   FilterChain   chain)   throws   IOException,   ServletException     
  {   
  request.setCharacterEncoding(encoding);   
  response.setContentType("text/html;charset="+encoding);   
  chain.doFilter(request,   response);   
  }   
    
  }   
    
    
  2、Java与数据库之间的乱码   
  大部分数据库都支持以unicode编码方式,所以解决Java与数据库之间的乱码问题比较明智的方式是直接使用unicode编码与数据库交互。很多数据库驱动自动支持unicode,如Microsoft的SQLServer驱动。其他大部分数据库驱动,可以在驱动的url参数中指定,如如mm的mysql驱动:jdbc:mysql://localhost/WEBCLDB?useUnicode=true&characterEncoding=GBK。   
    
  3、Java与文件/流之间的乱码   
  Java读写文件最常用的类是FileInputStream/FileOutputStream和FileReader/FileWriter。其中FileInputStream和FileOutputStream是基于字节流的,常用于读写二进制文件。读写字符文件建议使用基于字符的FileReader和FileWriter,省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式,如果文件内容与系统编码方式不一致,可能会出现乱码。在这种情况下,建议使用FileReader和FileWriter的父类:InputStreamReader/OutputStreamWriter,它们也是基于字符的,但在构造函数中可以指定编码类型:InputStreamReader(InputStream   in,   Charset   cs)   和OutputStreamWriter(OutputStream   out,   Charset   cs)。     
    
  4、其他   
  上面提到的方法应该能解决大部分乱码问题,如果在其他地方还出现乱码,可能需要手动修改代码。解决Java乱码问题的关键在于在字节与字符的转换过程中,你必须知道原来字节或转换后的字节的编码方式,转换时采用的编码必须与这个编码方式保持一致。我们以前使用Resin服务器,使用smartUpload组件上传文件,上传文件同时传递的中文参数获取没有乱码问题。当在Linux中把Resin设置成服务后,上传文件同时的中文参数获取出现了乱码。这个问题困扰了我们很久,后来我们分析smartUpload组件的源文件,因为文件上传采用的是字节流的方式,里面包含的参数名称和值也是字节流的方式传递的。smartUpload组件读取字节流后再将参数名称和值从字节流中解析出来,问题就出现在smartUpload将字节流转换成字符串时采用了系统默认的编码,而将Resin设置成服务后,系统默认的编码可能发生了改变,因此出现了乱码。后来,我们更改了smartUpload的源文件,增加了一个属性charset和setCharset(String)方法,将upload()方法中提取参数语句:   
  String   value   =   new   String(m_binArray,   m_startData,   (m_endData   -   m_startData)   +   1   );   
  改成了   
  String   value   =   new   String(m_binArray,   m_startData,   (m_endData   -   m_startData)   +   1,   charset   );   
  终于解决了这个乱码问题。

 

我遇到的问题:

问题帖子原文:我在MySQL的表中中存储了一些SQL语句,用JSP读出这些语句,然后用这些语句,结果却出现这样的错误: 
om.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '??,??,??? from CHART' at line 1 

解决方法:

  1. 问题解决了,在context.xml文件中的jdbc url中加入?characterEncoding=UTF-8就可以了,但这个url似乎只接受一个这种变量,我试过&和?,都没成功,估计其它地方配置还有些问题,或者我这个版本的mysql的url分割符有些改变。 
    问题发生的原因我觉得是java与数据库进行交互时会将char->byte,即将字符串转为字节流,然后数据库在将字节流转回字符时格式发生了变化,不知道mysql里面怎么设置可以让它的编码为utf-8. 
    不过这个问题既然已经在功能上没什么问题了,就先结贴吧。
  2. 加一个过滤器,在web.xml中配置一个过滤器。这种方法我没试,我觉得应该是种很不错的方法,原理也没怎么看懂,尤其是如何判断原文件的编码格式,有时间一定弄一下试试。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值