网络传输中文编码问题


以下文章复制自http://blog.sina.com.cn/s/blog_7a3510120100xt5b.html

1.要解决中文乱码问题,首先得了解什么是字符编码

   计算机要处理各种字符,就需要将字符和二进制内码对应起来,这种对应关系就是字符编码。要制定字符编码首先要确定字符集,并将

   字符集内的字符排序,然后和二进制数字对应起来,根据字符集内字符的多少,确定几个字节来编码。

2.常用的字符编码

   ASCII 编码是目前计算机中常用的最广泛地 字符集及其编码。ISO-8859-1可以表示的是西欧语言,看起来很单一,但是由于是单字节编码,与计算机最基础的表示单位一致,所以在很多时候,仍旧 使用ISO-8859-1编码来表示,而且在很多协议上默认使用这种编码。Unicode编码(统一码),通常所说的UTF-8就是Unicode编码的 实现方式。GB2312字集是简体字集;BIG5字集是台湾繁体字集;GBK字集是简繁字集;GB18030 是国家制定的一个强制性大字集标准;Linux系统默认的使用的是ISO-8859-1编码,。现在的PC平台必须支持GB18030,对嵌入式产品暂不 作要求。所以手机、MP3一般只支持GB2312。
3.网络传输产生中文乱码原因

   网络通信中,产生乱码的原因主要是通信过程中使用了不同的编码方式:服务器中的编码方式,传输过程中的编码方式,传输到达终端设备的编码方式。因此在传输 过程中就需要至少两次编码转换:首先从服务器编码转为网络编码,再从网络编码转为终端设备编码。在转换的过程中出现任何情况都可能出现编码混乱。

4.处理中文乱码问题常用三种方式解决

  (1)由于大部分终端设备都支持Unicode字符集,所以在连接网页时,我们希望网页数据在网络传输时使用UTF-8方式传输,我们就可以将UTF-8 转化为Unicode字符集。下面我们将通信过程中得到的流转化为字节,然后再将字节按GB2312 的方式进行转换得到字符串。

       InputStream is = conn.getInputStream();

       BufferedInputStream bis = new BufferedInputStream(is);

       byte  bytearray[] = new  byte[1024];

        int current= -1;

        int i=0;

        while((current=bis.read())!=-1) {

            bytearray[i] =(byte) current;

             i++;

      }

     resultData = new String (bytearray,"GB2312");//网络中以字节想形式默认为UTF-8进行编码,以GB2312显示到终端

     通过上面的转换,“resultData”字符串便可以显示中文效果了。
      (2)另一种方式是书记在传递的过程中使用ISO-8859-1字符集,这样就是直接使用了ASCII编码方式,当然在传递到终端设备时,需要将其数据反转才能够正常的显示。下面我们将一个字符串按ISO-8859-1字符集进行转换为gbk,代码如下:

      public static String formatStr(String str){

        if(str==null || str.length()==0){

          return "";

       }

       try{

         return new String (str.getBytes("ISO-8859-1"),"gbk");  //先在网络中以ISO-8859-1进行编码,再以gbk输出到终端

     }

    }

3. 第三种比较简单

InputStream is = conn.getInputStream();

BufferedInputStream bis = new BufferedInputStream(new InputStreamReader(is,"gb2312"));//gbk也行

这样设置下相当于直接用默认编码转为byte数组,再用指定的编码编成字符

总结:归根结底,解决中文乱码只需要两个步骤

·使用getBytes("编码方式");来对汉字进行重编码,得到它的字节数组。

·再使用new String (Bytes[],"解码方式");来对字节数组进行相应的解码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值