对于我们常用的GBK中,英文是占用1个字节,中文是2个
对于UTF-8,英文是1个,中文是3个
对于Unicode,英文中文都是2个
Java的流操作分为字节流和字符流两种。
1、 字节流
所有的读操作都继承自一个公共超类java.io.InputStream类。
所有的写操作都继承自一个公共超类java.io.OutputStream类。
InputStream和OutputStream都是抽象类。
InputStream有6个低级输入流:
低级流
流的用途
ByteArrayInputStream
从内存数组中读取数据字节
FileInputStream
从本地文件系统中读取数据字节
PipedInputStream
从线程管道中读取数据字节
StringBufferInputStream
从字符串中读取数据字节
SequenceInputStream
从两个或多个低级流中读取数据字节,当到达流的末尾时从一个流转到另一个流
System.in
从用户控制台读取数据字节
InputStream还有一个子类:过滤器流java.io.FilterInputStream。过滤器流即能把基本流包裹起来,提供方便的用法。
FilterInputStream 类的构造方法为FilterInputStream(InputStream),在指定的输入流之上,创建一个输入流过滤器。
FilterInputStream的常用的子类
过滤器输入流
流的用途
BufferedInputStream
缓冲区对数据的,以提高效率
DataInputStream
从输入流中读取基本数据类型,如int、float、double或者甚至一行文本
LineNumberInputStream
在翻译行结束符的基础上,维护一个计数器,该计数器表明正在读取的是哪一行。
PushbackInputStream
允许把数据字节向后推到流的首部
OutputStream(略)
OutputStream的结构基本和InputStream是一样的。
2、 字符流
注:是在jdk1.1里面引进的,上面字节流是在jdk1.0引进的。当用于处理文本数据时,选择字符流比字节流更好。但对只出路基本数据类型的开发者,可以继续使用字节流。
所有的读操作都继承自一个公共超类java.io.Reader类。
所有的写操作都继承自一个公共超类java.io.Writer类。
同样Reader和Writer也是抽象类。
Reader的常用的子类
低级读取器
流的用途
CharArrayReader
从字符数组中读取数据
InputStreamReader
FileReader(InputStreamReader的子类)
从本地文件系统中读取字符序列
StringReader
从字符串中读取字符序列
PipedReader
从线程管道中读取字符序列
InputStreamReader重点讲解:
InputStreamReader是从输入流中读取数据,连接输入流于读取器。如:
new InputStreamReader(System.in)
构造方法:
InputStreamReader(InputStream)
用缺省的字符编码方式,创建一个 InputStreamReader。
InputStreamReader(InputStream, String)
用已命名的字符编码方式,创建一个 InputStreamReader。
常用的过滤器读取器:
过滤器读取器
流的用途
BufferedReader
缓冲数据的,以提高效率
LineNumberReader(BufferedReader的子类)
维护一个计数器,该计数器表明正在读取的是哪一行。
FilterReader(抽象类)
提供一个类创建过滤器时可以扩展这个类
PushbackReader(FilterReader的子类)
允许把文本数据推回到读取器的流中
这些过滤器读取器都可以传入一个Reader作为构造方法的参数。
Writer(略)
Writer的结构基本和Reader是一样的。
字节流是最基本的,字符流是为了处理字符而提出来的。
new BufferedReader(new InputStreamReader(client.getInputStream()));解释:
client.getInputStream()是字节流;
InputStreamReader把字节流转换成字符流;
BufferedReader缓冲字符流,使得能够使用readline()等方法,直接读取一行
字节流与字符流主要的区别是他们的的处理方式
字节流是最基本的,所有的InputStrem和OutputStream的子类都是,主要用在处理二进制数据,它是按字节来处理的
但实际中很多的数据是文本,又提出了字符流的概念,它是按虚拟机的encode来处理,也就是要进行字符集的转化。在从字节流转化为字符流时,实际上就是byte[]转化为String时,
public String(byte bytes[], String charsetName)
有一个关键的参数字符集编码,通常我们都省略了,那系统就用操作系统默认的lang
所有文件的储存是都是字节(byte)的储存,在磁盘上保留的并不是文件的字符而是先把字符编码成字节,再储存这些字节到磁盘。在读取文件(特别是文本文件)时,也是一个字节一个字节地读取以形成字节序列.
int i= 7 那么i为一个字符.在Java中用两个字节表示值为0x0007
1.字节流可用于任何类型的对象,包括二进制对象,而字符流只能处理字符或者字符串;
2. 字节流提供了处理任何类型的IO操作的功能,但它不能直接处理Unicode字符,而字符流就可以。
______________________________________________________________________________________________
字节流是最基本的,所有的InputStrem和OutputStream的子类都是,主要用在处理二进制数据,它是按字节来处理的
但实际中很多的数据是文本,又提出了字符流的概念,它是按虚拟机的encode来处理,也就是要进行字符集的转化
这两个之间通过 InputStreamReader,OutputStreamWriter来关联,实际上是通过byte[]和String来关联
在实际开发中出现的汉字问题实际上都是在字符流和字节流之间转化不统一而造成的
在从字节流转化为字符流时,实际上就是byte[]转化为String时,
public String(byte bytes[], String charsetName)
如//把字符串按GB2312解码
hello = new String(hello.getBytes(), "GB2312");
有一个关键的参数字符集编码,通常我们都省略了,那系统就用操作系统的lang
而在字符流转化为字节流时,实际上是String转化为byte[]时,
byte[] String.getBytes(String charsetName)
如//把字符串按UTF8解码成字节流,并打印相应的字节
hello = new String(hello.getBytes("UTF8"));
也是一样的道理
至于java.io中还出现了许多其他的流,按主要是为了提高性能和使用方便,
如BufferedInputStream,PipedInputStream等