java字节流处理汉字

       今天在学习字节流读取数据,发现返回的是int类型(具体原因可以百度,挺简单的),发现这种情况下是读不了汉字的,但是又转念一想,汉字无非就是两个字节,读两次,然后自己处理一下,未尝不可,于是就产生了这篇博客。

       刚开始,总是不成功,后来,想到可能是记事本编码问题的原因,改记事本文件编码格式为unicode,再次运行程序。

先贴一下代码:

public class FileputStream {

	public static void main(String[] args) throws Exception {
		File file = new File("d:/a/e.txt");
		FileInputStream in = new FileInputStream(file);
		char ch = '一';
		System.out.println("汉字:"+(int)ch);
		fun((int)ch);
		ch = '二';
		System.out.println("汉字:"+(int)ch);
		fun((int)ch);
		int temp;
		while((temp=in.read())!=-1){
			System.out.println("字节"+temp);
			fun(temp);
		}
		in.close();
	}
	static void fun(int x){
		while(x>0){
			System.out.print(x % 2);
			x = x/2;
		}
		System.out.println("\n");
	}

}
运行结果:

汉字:19968
000000000111001

汉字:20108
001100010111001

字节255
11111111

字节254
01111111

字节0


字节78
0111001

字节140
00110001

字节78
0111001

       可见,除了开头有两个标志性的字节,后面的内容已经读了出来,现在就该把读出来的字节处理一下,转成char类型。(记事本里面的内容为“一二”)

代码如下:

public class FileputStream {

	public static void main(String[] args) throws Exception {
		File file = new File("d:/a/e.txt");
		FileInputStream in = new FileInputStream(file);
		int temp1;
		int temp2;
		in.skip(2);
		while((temp1=in.read())!=-1 & (temp2=in.read())!=-1){
			temp1 = (temp2<<8) + temp1;
			System.out.println((char)temp1);
		}
		in.close();
	}
}
运行结果为:



       总结:最关键的一点是,一定要把txt文件改成unicode编码格式,不过这样会造成前面多两个无用的字节(对,这两个字节就是因为unicode编码格式才会出来的,其他的编码格式不清楚,反正anis编码格式是不会出现这种情况的)。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值