java字节流处理汉字

最新推荐文章于 2024-09-10 09:08:41 发布

xiao_programmer

最新推荐文章于 2024-09-10 09:08:41 发布

阅读量1.7k

点赞数

文章标签： java 字节流

本文链接：https://blog.csdn.net/xiao_programmer/article/details/78142631

版权

今天在学习字节流读取数据，发现返回的是int类型（具体原因可以百度，挺简单的），发现这种情况下是读不了汉字的，但是又转念一想，汉字无非就是两个字节，读两次，然后自己处理一下，未尝不可，于是就产生了这篇博客。

刚开始，总是不成功，后来，想到可能是记事本编码问题的原因，改记事本文件编码格式为unicode，再次运行程序。

先贴一下代码：

public class FileputStream {

	public static void main(String[] args) throws Exception {
		File file = new File("d:/a/e.txt");
		FileInputStream in = new FileInputStream(file);
		char ch = '一';
		System.out.println("汉字："+(int)ch);
		fun((int)ch);
		ch = '二';
		System.out.println("汉字："+(int)ch);
		fun((int)ch);
		int temp;
		while((temp=in.read())!=-1){
			System.out.println("字节"+temp);
			fun(temp);
		}
		in.close();
	}
	static void fun(int x){
		while(x>0){
			System.out.print(x % 2);
			x = x/2;
		}
		System.out.println("\n");
	}

}

运行结果：

汉字：19968
000000000111001

汉字：20108
001100010111001

字节255
11111111

字节254
01111111

字节0

字节78
0111001

字节140
00110001

字节78
0111001

可见，除了开头有两个标志性的字节，后面的内容已经读了出来，现在就该把读出来的字节处理一下，转成char类型。（记事本里面的内容为“一二”）

代码如下：

public class FileputStream {

	public static void main(String[] args) throws Exception {
		File file = new File("d:/a/e.txt");
		FileInputStream in = new FileInputStream(file);
		int temp1;
		int temp2;
		in.skip(2);
		while((temp1=in.read())!=-1 & (temp2=in.read())!=-1){
			temp1 = (temp2<<8) + temp1;
			System.out.println((char)temp1);
		}
		in.close();
	}
}

运行结果为：

一
二
总结：最关键的一点是，一定要把txt文件改成unicode编码格式，不过这样会造成前面多两个无用的字节（对，这两个字节就是因为unicode编码格式才会出来的，其他的编码格式不清楚，反正anis编码格式是不会出现这种情况的）。