Java中文问题

原创 2001年05月05日 01:11:00
在处理中文的时候经常是new String(str.getBytes("编码方式1"), "编码方式2");
在这里我的理解有3点:
1。java里的字符串都是Unicode来表示的
2。String.getBytes("编码方式")是将用unicode表示的字符串 按照指定的编码方式转换
为一个byte数组
3。new String(byte[], "编码方式"),则是将给定的byte数组按照指定编码方式来解释,
得到一个unicode编码的字符串。

而通常的乱码问题是因为:
传送字符串给java程序时,没有考虑读入的字符串的实际编码类型(GBK),统一按照某一
编码方式(比如8859)来编码,这样我们在程序里就需要先getBytes("8859")还原得到
按照实际编码类型组织的byte数组,然后在new String(byte, "GBK")就可以得到正确的
字符串了.

以上是我对中文问题的理解。
我的说法是否正确的关键是上面我列出的那3点是不是正确的。
问题已经困饶我好久了,请高手指点。
多谢,多谢。

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: FoolsGarden (和水木清华谈恋爱), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 13:59:34 2001)

关于这个问题,我曾经有过研究,你的理解错了,呵呵
【 在 goldstar (淡水河畔的烟火) 的大作中提到: 】
: 在处理中文的时候经常是new String(str.getBytes("编码方式1"), "编码方式2");
: 在这里我的理解有3点:
: 1。java里的字符串都是Unicode来表示的
默认编码
: 2。String.getBytes("编码方式")是将用unicode表示的字符串 按照指定的编码方式转换
: 为一个byte数组
这个没有错,不过本来就是这样的
: 3。new String(byte[], "编码方式"),则是将给定的byte数组按照指定编码方式来解释,
: 得到一个unicode编码的字符串。
这个错了,也是你有错误结论的地方
: 而通常的乱码问题是因为:
: 传送字符串给java程序时,没有考虑读入的字符串的实际编码类型(GBK),统一按照某一
: 编码方式(比如8859)来编码,这样我们在程序里就需要先getBytes("8859")还原得到
: 按照实际编码类型组织的byte数组,然后在new String(byte, "GBK")就可以得到正确的
: ...................

--
秀才戒网了……

※ 来源:·BBS 水木清华站 smth.org·[FROM: 166.111.77.2]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 14:02:25 2001)

呵呵,太好了,请指点一下吧。
多谢,多谢
//bow

【 在 FoolsGarden (和水木清华谈恋爱) 的大作中提到: 】
: 关于这个问题,我曾经有过研究,你的理解错了,呵呵
: 默认编码
: 这个没有错,不过本来就是这样的
: 这个错了,也是你有错误结论的地方

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 14:04:22 2001)

new String到底是什么意思?
//bow

【 在 FoolsGarden (和水木清华谈恋爱) 的大作中提到: 】
: 关于这个问题,我曾经有过研究,你的理解错了,呵呵
: 默认编码
: 这个没有错,不过本来就是这样的
: 这个错了,也是你有错误结论的地方

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: FoolsGarden (和水木清华谈恋爱), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 14:05:30 2001)

类的构造,就是一个实例产生了
【 在 goldstar (淡水河畔的烟火) 的大作中提到: 】
: new String到底是什么意思?
: //bow

--
秀才戒网了……

※ 来源:·BBS 水木清华站 smth.org·[FROM: 166.111.77.2]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 14:47:20 2001)

不是,我是问,new String(byte[], "encodeMethod");
中指定的编码方式和byte数组的关系是什么?

【 在 FoolsGarden (和水木清华谈恋爱) 的大作中提到: 】
: 类的构造,就是一个实例产生了

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: FoolsGarden (和水木清华谈恋爱), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 14:54:02 2001)

byte是什么,就是2进制数的三说
当然计算机中信息都是以二进制存储的,编码方式的指定
只是为构造String类是对byte数组怎么解码后构成String
的,如果编码方式不同,相信Sring也不一样
【 在 goldstar (淡水河畔的烟火) 的大作中提到: 】
: 不是,我是问,new String(byte[], "encodeMethod");
: 中指定的编码方式和byte数组的关系是什么?

--
秀才戒网了……

※ 来源:·BBS 水木清华站 smth.org·[FROM: 166.111.77.2]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 14:58:05 2001)

那我第3点错在哪呢?

呵呵,我悟性不高,还请指点的说 //blush
//bow
【 在 FoolsGarden (和水木清华谈恋爱) 的大作中提到: 】
: byte是什么,就是2进制数的三说
: 当然计算机中信息都是以二进制存储的,编码方式的指定
: 只是为构造String类是对byte数组怎么解码后构成String
: 的,如果编码方式不同,相信Sring也不一样

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: FoolsGarden (和水木清华谈恋爱), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 15:01:10 2001)

得到unicode有误,自己理解吧,我要走了
【 在 goldstar (淡水河畔的烟火) 的大作中提到: 】
: 那我第3点错在哪呢?
: 呵呵,我悟性不高,还请指点的说 //blush
: //bow

--
秀才戒网了……

※ 来源:·BBS 水木清华站 smth.org·[FROM: 166.111.77.2]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 15:04:20 2001)

好吧,多谢指点
//bow

【 在 FoolsGarden (和水木清华谈恋爱) 的大作中提到: 】
: 得到unicode有误,自己理解吧,我要走了

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 15:11:35 2001)

我觉得是new String(byte[], "编码方式")中,按照编码方式来解释byte数组
得到一个按指定编码方式编码字符串,又因为java里字符串都是Unicode表示的。
所以,最终是得到了一个Unicode的字符串

【 在 FoolsGarden (和水木清华谈恋爱) 的大作中提到: 】
: 得到unicode有误,自己理解吧,我要走了

--

※ 来源:·BBS 水木清华站 smth.org·[FROM: 162.105.183.50]
发信人: goldstar (淡水河畔的烟火), 信区: Java
标 题: Re: 问个java中文的问题
发信站: BBS 水木清华站 (Sat Mar 10 15:20:22 2001)

领悟了,领悟了,的确错了。
感谢FoolsGarden的大力帮助。
//bow
也祝愿本版越来越火
【 在 goldstar (淡水河畔的烟火) 的大作中提到: 】
: 我觉得是new String(byte[], "编码方式")中,按照编码方式来解释byte数组
: 得到一个按指定编码方式编码字符串,又因为java里字符串都是Unicode表示的。
: 所以,最终是得到了一个Unicode的字符串

java中含中文字符串的编码和解码问题

java中含中文字符串的编码和解码问题。 1、在java开发中经常被文字乱码的问题困扰。下面全面解释下字符串的编码和解码。 如 String str = "中国" 编码:...
  • TuxedoLinux
  • TuxedoLinux
  • 2017年11月19日 21:55
  • 44

subString中英文截取问题以及方法

解决中英文字符截取的方法。
  • spring123tt
  • spring123tt
  • 2011年06月01日 18:57
  • 5262

Java String对中文长度的计算问题

Java String对中文长度的计算问题   2010-07-30 13:36:38|  分类: java |字号 订阅 Java String对中文长度的计算问题 今天在农行...
  • softmanfly
  • softmanfly
  • 2013年09月24日 11:23
  • 3422

java pdf写入中文时不显示,如何解决。

java中生成pdf文件需要用到java文件:iText 5.0.6.jar文件 只下载iText5.0.6.jar文件是不能写入中文到pdf文件,同时需要iTextAsian.jar 但是我们在使用...
  • nly19900820
  • nly19900820
  • 2015年12月07日 11:26
  • 4744

JAVA中文乱码问题的产生和建议解决办法

开发java应用出现乱码是很常见的,毕竟现在unicode的使用还不是很广泛,在使用gb2312(包含了gbk简体,big5繁体)的系统中要正确  实现中文的display和数据库的存储是最基本的要...
  • LVGAOYANH
  • LVGAOYANH
  • 2015年08月02日 12:08
  • 4726

文件下载 FileInputStream不能读取中文路径的问题

昨天在做文件下载的时候在java文件中对下载流进行处理,但是当路径中出现中文路径是,直接抛出异常,下面是java文件下载代码: import java.io.File; import java.io...
  • maoyeqiu
  • maoyeqiu
  • 2015年09月12日 12:51
  • 3034

java中文乱码问题解决方案整理

1、确保项目,jsp页面,数据库编码统一使用UTF-8。 2、修改tomcat的参数 第一处 修改tomcat编码 位置:tomcat安装路径/conf/server.xml useBodyEnc...
  • dragonpeng2008
  • dragonpeng2008
  • 2017年03月27日 11:48
  • 577

Java在不同的编码下面,一个中文占的字节不同

1. public static void main(String []args) throws UnsupportedEncodingException  {   2.     // 运行结果:2...
  • WEILIN19921214
  • WEILIN19921214
  • 2015年07月31日 15:18
  • 719

【Java】MD5工具类,解决中文转MD5不一致问题。

import java.security.MessageDigest;public class MD5Util { /** * * @Title: MD5 * @D...
  • tanglei6636
  • tanglei6636
  • 2017年02月07日 11:51
  • 647

java中获取包含中文字符的字符串长度

项目中,经常会遇到要截取字符的操作:有下面的方法 和之前的 Java的中英文混合截取字符串的问题解决方法 就无后顾之忧了 感谢各位前辈,小弟这里谢过了;尊重版权,转载注明出处   ^ . ^  !...
  • ynm_8023
  • ynm_8023
  • 2012年04月25日 16:20
  • 4220
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Java中文问题
举报原因:
原因补充:

(最多只允许输入30个字)