Java中IO流-19-字节流写中文的问题

      前面我们在介绍字节流读写文件都是用英文内容来介绍,那么如果用字节流来读取中文的文件内容会有什么问题呢?当然,我们前面文章提到过,除了字节流还有一种字符流,字符流用来用来处理纯字符的文件。这篇,我们还没有介绍字符流操作,我们尝试用字节流方式去读取文件,然后看看会发生什么问题吧.

     由于我们大部分人都是中文的操作系统,Eclipse安装之后,右键项目,属性,可以看到默认的编码方式是GBK,所以,我们不能一个一个字节去读取,这样的话肯定产生乱码。由于中文中GBK字符集,每个汉字都是采用2个字节存储,所以,我们下面利用小数组的方式来看看。(提前在当前项目下准备一个abc.txt文件,里面内容就四个汉字“你好你好”)

package io;

import java.io.FileInputStream;
import java.io.IOException;

public class Demo4_BufferCopy {

	public static void main(String[] args) throws IOException {
		
		FileInputStream fis = new FileInputStream("abc.txt");
		byte[] arr = new byte[3]; //数组长度为3个字节
		
		int len;
		while ( ( len = fis.read(arr)) != -1 ) {
			System.out.println(new String(arr,0,len));
		}
		
		fis.close();
	}

}

      上面代码,首先是创建一个3个字节的小数组,这个就是我们自定义的,有点类似缓冲区的意思。每次读取3个字节的长度,然后while循环中的打印语句部分,使用了String类的构造方法,把字节数组转换成字符串。上面的代码一定要你Eclipse项目右键,属性面板字符集显示GBK,运行才显示乱码,如果字符集是UTF-8,运行正常输出显示中文。

    显示乱码的原因就是每次都读取3个字节,但是GBK中一个汉字占两个字节,第一次读取3个字节,读取出了“你”和“好”的一半,这一半就显示乱码或者问号。如果你把数组长度改成一次性读取4个字节,那么问题就会消失。但是,如果你abc.txt中还包含其他的符号,例如逗号,点号等等,这种4个字节读取还是可能会出现乱码。所以,字节流读取中文还是不可靠,这个就需要字符流来干这个活。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值