PushbackInputStream

最新推荐文章于 2022-08-23 18:20:42 发布

xyhety

最新推荐文章于 2022-08-23 18:20:42 发布

阅读量246

点赞数

分类专栏：读书笔记文章标签： C C++ C#

本文链接：https://blog.csdn.net/xyhety/article/details/83369063

版权

读书笔记专栏收录该内容

52 篇文章 0 订阅

订阅专栏

1. java.io.PushbackInputStream拥有一个PushBack缓冲区，从PushbackInputStream读出数据后，只要PushBack缓冲区没有满，就可以使用unread()将数据推回流的前端。

2. 假设一个文本文件中同时存储有ASCII码范围的英文字符与BIG5范围的中文字符。想要判断那些位置是ASCII而哪些位置是BIG5中文字符，BIG5中文字符使用两个字节来表示一个中文字，而ASCII只使用一个字节来表示英文字符。

3. Big5中文为了与ASCII兼容，低字节范围内0xA4-0xF9，而高字节为0x40--0x7E以及0xA1--0xFE。存储时低字节先存，再存高字节，所以读取时只要先读到字节是在0xA4--0xF9，就表示它可能是一个中文字符的前半数据。

4. 下面的范例说明PushbackInputStream的功能，一次从文件中读取两个字节，并检查两个字节合并后的整数值是否在0xA440--0xFFFF之间，这样可以简单地判断其两个字节合并后是否为BIG码。如果是BIG5码则使用这两个字节产生String实例以显示汉字字符；如果不在这个范围之内，则可能是个ASCII范围内的字符，您可以显示第一个字节的字符表示，并将第二个字节推回流，以待下一次可以重新读取。

package ysu.hxy;

import java.io.*;

public class PushbackInputStreamDemo
{
	public static void main(String[] args)
	{
		try
		{
			PushbackInputStream pushbackInputStream =
				new PushbackInputStream(new FileInputStream(args[0]));

			byte[] array = new byte[2];

			int tmp = 0;
			int count = 0;

			while((count = pushbackInputStream.read(array))!=-1)
			{
				//两个字节转换为整数 
				tmp = (short)((array[0] << 8) | (array[1] & 0xff));
				tmp = tmp & 0xFFFF;

				//判断是否为BIG5，如果是则显示BIG5中文字
				if(tmp >= 0xA440 && tmp < 0xFFFF)
				{
					System.out.println("BIG5:" + new String(array));
				}
				else
				{
					//将第二个字节推回流
					pushbackInputStream.unread(array,1,1);
					//显示ASCII范围的字符
					System.out.println("ASCII: " + (char)array[0]);
				}
			}
			pushbackInputStream.close();
		}
		catch(ArrayIndexOutOfBoundsException e)
		{
			System.out.println("请指定文件名称");
		}
		catch(IOException e)
		{
			e.printStackTrace();
		}
	}
}

不过这段代码好象有问题：当test.txt里面内容是：a这y是c 时，运行结果如下：

ASCII: a
BIG5: 这
ASCII: y
BIG5: 是
ASCII: c
BIG5: 乔
如果最后一个不是英文的，而是一个汉字，显示是正确的。没找到原因。