Java程序的中文乱码问题研究

转载 2007年09月24日 17:51:00

1.引言
所有基于Java的应用程序都面临着一个让初学头痛和不解的中文乱码问题。本问就将揭开Java中文乱码问题由来的神秘面纱,并给出一些常用的解决Java中文乱码问题的解决方案.

2.Java中文乱码问题的由来
Java的内核和.Class文件都是基于Unicode的,这使得Java程序具有良好的跨平台性。但同时也正是由于这个因素,Java与生具来的带来了中文乱码的缺陷。产生乱码的因素有二。第一:Java和Jsp文件本身在编译时产生的乱码;第二:Java程序和其他媒介(如:数据库等)交互时产生的乱码.

3.解决方法
3.1 解决JSP页面中文显示乱码问题(局限于静态文本)
可在JSP页面中使用<%@ page>指令页面的字符编码集.如下所示:
<%@ page contentType="text/html;charset=GBK"%>
3.2 解决JSP中文显示乱码问题(局限于动态文本)
方法一:
<%= new String(request.getParameter("your_name").getBytes("8859_1"),"GB2312") %>  
方法二:
<% request.setCharacterEncoding("GB2312");%>
3.3 通过Tomcat解决JSP静态文本乱码问题
修改Tomcat的server.xml文件,如下所示:
<Connector port="80"     maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
                  enableLookups="false" redirectPort="8443" acceptCount="100"
                  debug="0" connectionTimeout="20000"
                  disableUploadTimeout="true"
                  URIEncoding="GBK"
/>
3.4 通过Struts提供的过滤器机制解决JSP动态文本乱码问题
在Web描述符配置文件中,做如下配置:
<!-- 字符编码转换过滤器 -->
<filter>
     <filter-name>EncodingFilter</filter-name>
     <filter-class>com.eRedLab.eRedCIP.system.filter.SetCharacterEncodingFilter</filter-class>
     <init-param>
      <param-name>encoding</param-name>
      <param-value>GBK</param-value>
     </init-param>
</filter>
<filter-mapping>
           <filter-name>EncodingFilter</filter-name>
           <url-pattern>/*</url-pattern>
       </filter-mapping>
SetCharacterEncodingFilter类具体代码:略

4.结束语
根据不同的Java应用环境,Java中文乱码的表现形式也形色各异。但只要我们掌握了其核心原理以及编码转换的通用方法,我们就可以在处理字符问题的时候以不变应万变,应对自如!

5.附录 几种常用的自符集编码转换方法
     /**
      * 转换编码 ISO-8859-1到GB2312
      */
     public String ISO2GB(String text) {
       String result = "";
       try {
         result = new String(text.getBytes("ISO-8859-1"), "GB2312");
       }
       catch (UnsupportedEncodingException ex) {
         result = ex.toString();
       }
       return result;
     }

/**
      * 转换编码 GB2312到ISO-8859-1
      */
     public String GB2ISO(String text) {
       String result = "";
       try {
         result = new String(text.getBytes("GB2312"), "ISO-8859-1");
       }
       catch (UnsupportedEncodingException ex) {
         ex.printStackTrace();
       }
       return result;
     }

/**
      * Utf8URL编码
      */
     public String Utf8URLencode(String text) {
       StringBuffer result = new StringBuffer();
       for (int i = 0; i < text.length(); i++) {
         char c = text.charAt(i);
         if (c >= 0 && c <= 255) {
           result.append(c);
         }else {
           byte[] b = new byte[0];
           try {
             b = Character.toString(c).getBytes("UTF-8");
           }catch (Exception ex) {
           }
           for (int j = 0; j < b.length; j++) {
             int k = b[j];
             if (k < 0) k += 256;
             result.append("%" + Integer.toHexString(k).toUpperCase());
           }
         }
       }
       return result.toString();
     }

     /**
      * Utf8URL解码
      */
     public String Utf8URLdecode(String text) {
       String result = "";
       int p = 0;
       if (text!=null && text.length()>0){
         text = text.toLowerCase();
         p = text.indexOf("%e");
         if (p == -1) return text;
         while (p != -1) {
           result += text.substring(0, p);
           text = text.substring(p, text.length());
           if (text == "" || text.length() < 9) return result;
           result += CodeToWord(text.substring(0, 9));
           text = text.substring(9, text.length());
           p = text.indexOf("%e");
         }
       }
       return result + text;
     }

 

Linux下Java程序中文乱码问题研究

Linux下Java程序中文乱码问题研究摘  要:在一个项目的开发中,我用linux内核源代码和busybox源代码自己编译打造的操作系统mylinux 1.0 ,服务器是我用java语言自己编写的一...
  • zenith_hu
  • zenith_hu
  • 2009年09月07日 10:52
  • 1108

Java程序的中文乱码问题

由于JDK是国际版的,在编译的时候,如果我们没有用-encoding参数指定我们的JAVA源程序的编码格式,则javac.exe首先获得我们操作系统默认采用的编码格式,也即在编译java程序时,若我们...
  • Damonon
  • Damonon
  • 2017年06月23日 20:33
  • 128

java程序解决中文乱码问题

解决中文乱码问题 1、中文问题的来源     计算机最初的操作系统支持的编码是单字节的字符编码,于是,在计算机中一切处理程序最初都是以单字节编码的英文为准进行处理。随着计算机的发展,为了适应世界其它民...
  • sweetsoft
  • sweetsoft
  • 2006年01月07日 22:41
  • 3012

解决java程序中文乱码问题

如果jsp页面使用的是get方式提交,如使用location.href=url,或ajax使用get方式提交 方法一: 后台程序中使用String name = request.getParame...
  • developerFBI
  • developerFBI
  • 2013年04月05日 11:41
  • 694

Linux下Java程序中文乱码问题

转载于:http://blog.chinaunix.net/u3/114157/showart_2245018.html 摘  要:在一个项目的开发中,我用linux内核源代码和busybox源代码自...
  • zgmzyr
  • zgmzyr
  • 2010年12月23日 22:59
  • 21020

常见中文乱码问题

日常工作中,中文乱码算是比较常见的问题了,大家或多或少都遇到过。这里简单分析下我遇到过的乱码场景,错误和遗漏之处,欢迎大家补充、纠正和交流。   一、常见乱码问题 1.1 Ajax请...
  • huangfan322
  • huangfan322
  • 2016年11月18日 17:14
  • 561

Servlet中文乱码问题研究

最近在做Ajax ,就利用Servlet与jsp实验ajax。 实验开始很顺利,但是在输入中文和服务器返回中文时,出现乱码,全部都显示????? 在最开始学习jsp的时候对中文乱码不明白。借此机会...
  • gaojiaweir0011
  • gaojiaweir0011
  • 2012年06月23日 10:31
  • 365

java web开发时表单提交引起的一些中文乱码问题

1、pageEncoding="UTF-8"的作用是设置JSP编译成Servlet时使用的编码。  2、contentType="text/html;charset=UTF-8"的作用是指定对服务器...
  • buqideyu
  • buqideyu
  • 2014年02月21日 18:51
  • 912

解决java web程序中文传参乱码问题

解决java web程序中文传参乱码问题
  • baohuan_love
  • baohuan_love
  • 2013年11月19日 14:25
  • 1183

JSP中文乱码问题终极解决方案(下)

本文首先从四个方面给出了在使用JSP过程中可能出现中文乱码的情形,具体包括JSP页面中文乱码、JSP源文件中文乱码、GET 请求的请求参数为中文乱码 和 POST 请求的请求参数为中文乱码四种情形,并...
  • justloveyou_
  • justloveyou_
  • 2017年02月19日 22:42
  • 5692
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Java程序的中文乱码问题研究
举报原因:
原因补充:

(最多只允许输入30个字)