Java的中文编程与配置心得

转载 2006年06月26日 10:38:00
Java的中文问题历史悠久,连绵不绝,至今也没有完全解决,但是上有政策下有对策,我们总是有
办法搞定它的。跟Java相关的中文问题主要有两类,一类是编程的问题,涉及到I/O,内码转换等。
第二类是Java运行环境的配置,涉及字体,属性配置等。我刚刚用了一天的时间解决这些问题,觉
得很有必要给自己写个备忘录之类的。 

我看还是从问题入手吧,这样不致于让大家打瞌睡。我想写个程序,这个程序有个基本功能就是显
示文件内容,我用JTextArea来做显示的事情,程序简单的到家了,但是就是中文都是乱码。我的
配置是JBuilder7,JBuilder自带的JDK1.3.3_b24,我自己装的JDK是JDK1.4.0_02_b02,都是主流的
JDK。操作系统是英文Windows2000加中文支持包。  

我尝试换JDK,1.3.3和1.4.0都不行,down一个最新的j2sdk-1_4_1-rc也是不行,好像不是JDK的问题,
于是我就把精力集中到I/O的编码转换上,我查阅了网上若干关于JAVA中文问题的文章,把编码转换搞
的倍儿清楚,可是怎么试,换什么编码折腾都不行,反而显示的更糟糕,当初还是乱的有些规矩,就
是象在纯英文系统上显示的那样,好歹我还知道那是汉字,只是显示不出来,等我折腾编码,就变得
都是问号了。唉,郁闷! 

编码转换心得: 

JAVA内部是UNICODE编码,在I/O时如果使用Reader/Writer就要发生编码转换,使用系统属性
file.encoding作为编码方式。如果使用Stream就没有转换的事情了,那是Binary的数据。 

有用的方法有:1。在Reader/Writer上加encoding的选项,注意编码的方向,在Reader中的encoding
表示把数据从encoding转换成Unicode,writer就是把Unicode的字符转换成encoding格式的。2。用
String.getByte()把字符串转换成指定编码。 

常用的编码格式:ISO8859_1,这个是英文系统缺省的8bit编码,因为是8bit的,所以不会把汉字的
高位删去,所以用它也是可以处理汉字的(我自己这么理解,总觉得有些不妥,但又不知道不妥在何
处,还望高人指出)。GB2312和GBK,汉字编码,推荐使用GBK,它兼容GB2312并且支持更多汉字。
UNICODE,一个大的字符集,不知是不是国际标准反正大家都支持,使用16位对每个字符编码,汉字虽
然正合适,但英文却吃亏了,要用多一倍的空间来存储,所以很多人还是老大不乐意,写的程序不支
持UNICODE。 

JSP/Servlet的中文问题有两种解决办法:1。不在程序中进行编码转换,把这个工作交给浏览器,
方法就是用javac –encoding GBK *.java来编译所有的bean,然后在JSP页面上加 

<%@ page contentType="text/html;charset=gb2312" %>

或者是在HTML中直接加: 

到底加那个,试试就知道了,我也搞不清楚了。 

2。在程序中指定编码,用javac –encoding ISO8859_1 *.java来编译所有的bean,在涉及到中文显
示的程序上加 

str=new String(str.getBytes("ISO8859_1"); 

上面两种方法不能混用,意思就是要么就是GBK,要么就是ISO8859_1,从里到外都一样就好了。 

数据库JDBC的中文问题,一般只要按照数据库指定的编码进行转换,比如按照ISO8859_1读,ISO8859_1写,一般就没什么问题了。 

虽然有这些编码上的心得,但是并不能解决我的问题。看来我的程序输入输出用的都是ISO8859_1,我
的问题跟编码没什么关系。是不是字体的问题呢?在Swing的组件中,字体总是那么几个,基本上是定
死的,选那个都不行。但是我突然发现可以更改这些字体的配置,就是font.properties 这个文件,
一般JDK都带了中文的字体配置文件,可能是font.properties.zh之类的,不同版本的JDK名字有些差别,
你要做的就是用中文的配置覆盖font.properties文件。我满心欢喜的以为成功了,但是失败无情的又一
次打击了我。不是这种方法不对,但是在Windows系统中,java能够比较自动的检查你的系统编码,使用
最合适的字体配置文件,一般不需要你改动了,在JDK1.2之前确实是要这么改的,难怪那篇文章是JDK1.1
的文档呢。 

连font.properties也不灵了,唉,是不是JBuilder有问题呀?到了这儿,我不得不怀疑它了,虽然它从
没让我失望过,我关掉JBuilder,拿起JDK命令行,哎呀!可爱的中文竟然出来了!简直是.....莫名其
妙呀,因为JBuilder也是用的这个JDK呀?没理由呀,我再次打开JBuilder,运行,乱码!怪事.......
我来看看.....我把JBuilder里面的执行命令拷贝到DOS窗口里手动执行....没有中文.....怪怪怪,我仔
细对照我手敲的命令和JBuilder拷出来的命令,除了我用的是java它用的是javaw之外,别的几乎都一样,
难道.......这个java和javaw竟然会不一样? 

唉.......要我说什么呢,答案就是这个了,javaw会使用与java不同的Local配置进行工作,导致了我一
直看不到中文,而java就是好好的。JBuilder也是好好的,没有问题,调用javaw也不是它的错,难道你
想每次运行或者调试的时候蹦出个DOS黑框么?呵呵。这是JDK的一个Bug,我在java的网站上查到这个
bug,描述的情况跟我的一样,然后Sun说这个Bug已经修复了,嘿嘿,简直就是扯淡!修复个茄子!Bug
编号是:4629351。不信可以去看看。 

但是难道我就不能在JBuilder里面看我可爱的中文了吗?好像JBuilder5的时候还能选择是用java还是
javaw,现在好像没法儿选了。怎么才能让javaw支持中文呢?经过又是一番苦苦查找,竟然没有什么
结果,郁闷!正当苦闷之时,突然想起当初配置过UNIX下的TOMCAT,好像加了些启动参数,就能让
tomcat支持中文了,赶快翻出以前的文档,啊,幸好我当初写了工作心得,要不然又抓瞎了。其实道
理很简单,就是给JAVA虚拟机加上一些属性: 

-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN 

把它跟在javaw的命令行后面当参数,哈哈,搞定! 

在JBuilder中选择Project->Project Properties->run->edit->VM Parameters,填上就行了! 

配置心得: 

在JDK低版本和UNIX下,需要改动font.properties,让JAVA VM能够找到合适的字体来显示汉字。 

目前为止,javaw有Bug,只使用英文的Local,需要给VM加上属性才行正常显示中文。

相关文章推荐

JAVA编程心得-Eclipse/MyEclipse 中文乱码解决办法

将别人的项目或JAVA文件导入到自己的Eclipse中时,常常会出现JAVA文件的中文注释变成乱码的情况,主要原因就是别人的IDE编码格式和自己的Eclipse编码格式不同。 总结网上的建议和自己的...

Java/JSP中文乱码问题解决心得

自从接触Java和JSP以来,就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。一、Java中文问题的由来Java的内核和class文件是基于unicode...
  • gyflyx
  • gyflyx
  • 2011年04月25日 14:36
  • 641

Java版本word2vec跑中文数据使用心得

笔者目前在研究中文情感分析,其中考虑到使用word2vec来对词进行量化,从而可以达到计算词相似度或者之后拓展其他用法的目的。由于项目是Java版的,所以研究的是java版本的word2vec在此写下...
  • czs1130
  • czs1130
  • 2016年11月26日 21:37
  • 5390

java编程心得 注意的地方

  • 2008年10月24日 16:23
  • 15KB
  • 下载

java编程心得.txt

  • 2010年06月17日 09:58
  • 2KB
  • 下载

Java学习心得之GUI编程(二)

一、事件监听 测试代码一: public class TestActionEvent { public static void main(String args[]) { ...

Java编程规范的心得

听了子柳讲的Java编程的规范,“这里每一个规范都有淘宝开发人员一段悲惨的经历,这是一部开发人员的血泪史”——子柳(百技大学的校长)。鉴于测试部门目前也要编写ruby脚本和进行webx测试,为了避免我...

Java 编程心得体会:程序员应具有的素质

程序员是一种技术工作,在IT的发展中有相当重要的地位,从底层硬件通讯协议的建立,到数据传输层的处理,到操作系统的建设,到数据库平台的建设,一直到应用层上各种数据营销平台的搭建,程序员在里面都扮演着举足...

Java入门:缓冲区溢出编程心得

Java入门:缓冲区溢出编程心得2010-07-16 11:43 中国IT实验室 佚名  关键字:Java    前言:网上关于缓冲区溢出的资料也有很多,但我在阅读过程中发现介绍的都不是很明了,而...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Java的中文编程与配置心得
举报原因:
原因补充:

(最多只允许输入30个字)