流的概念和作用
流是一组有顺序的,有起点和终点的字节集合,是对数据传输的总称或抽象。即数据在两设备间的传输称为流,流的本质是数据传输,根据数据传输特性将流抽象为各种类,方便更直观的进行数据操作。
IO流的分类
- 根据处理数据类型的不同分为:字符流和字节流
- 根据数据流向不同分为:输入流和输出流
字符流和字节流
字符流的由来: 因为数据编码的不同,而有了对字符进行高效操作的流对象。本质其实就是基于字节流读取时,去查了指定的码表。 字节流和字符流的区别:
- 读写单位不同:字节流以字节(8bit)为单位,字符流以字符为单位,根据码表映射字符,一次可能读多个字节。
- 处理对象不同:字节流能处理所有类型的数据(如图片、avi等),而字符流只能处理字符类型的数据。
结论:只要是处理纯文本数据,就优先考虑使用字符流。 除此之外都使用字节流。
输入流和输出流
对输入流只能进行读操作,对输出流只能进行写操作,程序中需要根据待传输数据的不同特性而使用不同的流。
Java流类图结构:
字符输入输出流代码:
public class FileWriteDemo {
public static void main(String[] args) {
FileWriter writer = null;
try {
writer = new FileWriter("/home/ubuntu/a.txt",true);//true表示追加
writer.write("你好,中国!\r\n");
writer.write("hello world!\n\r");
writer.write("回车换行\r\n");
} catch (IOException e) {
e.printStackTrace();
}finally {
try {
if(writer != null)
writer.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
publicclass FileReadDemo {
public static void main(String[] args) throws IOException {
FileReader fileReader = new FileReader("/home/ubuntu/a.txt");
int lenth = 0;
//使用char[]缓冲区读取文件
char[] buf = new char[10];//定义缓冲区
while((lenth = fileReader.read(buf)) != -1){
String s = new String(buf,0,lenth);
System.out.print(s);
}
fileReader.close();
}
}
Java IO流对象
1.输入字节流InputStreamIO 中输入字节流的继承图可见上图,可以看出:
- InputStream 是所有的输入字节流的父类,它是一个抽象类。
- ByteArrayInputStream、StringBufferInputStream、FileInputStream 是三种基本的介质流,它们分别从Byte 数组、StringBuffer、和本地文件中读取数据。PipedInputStream 是从与其它线程共用的管道中读取数据
- ObjectInputStream (对象输入流)和所有FilterInputStream 的子类都是装饰流(装饰器模式的主角)。
2.输出字节流OutputStream
IO 中输出字节流的继承图可见上图,可以看出:
- OutputStream 是所有的输出字节流的父类,它是一个抽象类。
- ByteArrayOutputStream、FileOutputStream 是两种基本的介质流,它们分别向Byte 数组、和本地文件中写入数据。PipedOutputStream 是向与其它线程共用的管道中写入数据,
- ObjectOutputStream 和所有FilterOutputStream 的子类都是装饰流。
3.字节流的输入与输出的对应
图中蓝色的为主要的对应部分,红色的部分就是不对应部分。紫色的虚线部分代表这些流一般要搭配使用。从上面的图中可以看出Java IO 中的字节流是极其对称的。“存在及合理”我们看看这些字节流中不太对称的几个类吧!
- LineNumberInputStream 主要完成从流中读取数据时,会得到相应的行号,至于什么时候分行、在哪里分行是由改类主动确定的,并不是在原始中有这样一个行号。在输出部分没有对应的部分,我们完全可以自己建立一个LineNumberOutputStream,在最初写入时会有一个基准的行号,以后每次遇到换行时会在下一行添加一个行号,看起来也是可以的。好像更不入流了。
- PushbackInputStream 的功能是查看最后一个字节,不满意就放入缓冲区。主要用在编译器的语法、词法分析部分。输出部分的BufferedOutputStream 几乎实现相近的功能。
- StringBufferInputStream 已经被Deprecated,本身就不应该出现在InputStream 部分,主要因为String 应该属于字符流的范围。已经被废弃了,当然输出部分也没有必要需要它了!还允许它存在只是为了保持版本的向下兼容而已。
- SequenceInputStream 可以认为是一个工具类,将两个或者多个输入流当成一个输入流依次读取。完全可以从IO 包中去除,还完全不影响IO 包的结构,却让其更“纯洁”――纯洁的Decorator 模式。
- PrintStream 也可以认为是一个辅助工具。主要可以向其他输出流,或者FileInputStream 写入数据,本身内部实现还是带缓冲的。本质上是对其它流的综合运用的一个工具而已。一样可以踢出IO 包!System.out 和System.out 就是PrintStream 的实例!
4.字符输入流Reader
在上面的继承关系图中可以看出:
- Reader 是所有的输入字符流的父类,它是一个抽象类。
- CharReader、StringReader 是两种基本的介质流,它们分别将Char 数组、String中读取数据。PipedReader 是从与其它线程共用的管道中读取数据。
- BufferedReader 很明显就是一个装饰器,它和其子类负责装饰其它Reader 对象。
- FilterReader 是所有自定义具体装饰流的父类,其子类PushbackReader 对Reader 对象进行装饰,会增加一个行号。
- InputStreamReader 是一个连接字节流和字符流的桥梁,它将字节流转变为字符流。FileReader 可以说是一个达到此功能、常用的工具类,在其源代码中明显使用了将FileInputStream 转变为Reader 的方法。我们可以从这个类中得到一定的技巧。Reader 中各个类的用途和使用方法基本和InputStream 中的类使用一致。后面会有Reader 与InputStream 的对应关系。
5.字符输出流Writer
在上面的关系图中可以看出:
- Writer 是所有的输出字符流的父类,它是一个抽象类。
- CharArrayWriter、StringWriter 是两种基本的介质流,它们分别向Char 数组、String 中写入数据。PipedWriter 是向与其它线程共用的管道中写入数据,
- BufferedWriter 是一个装饰器为Writer 提供缓冲功能。
- PrintWriter 和PrintStream 极其类似,功能和使用也非常相似。
- OutputStreamWriter 是OutputStream 到Writer 转换的桥梁,它的子类FileWriter 其实就是一个实现此功能的具体类(具体可以研究一SourceCode)。功能和使用和OutputStream 极其类似,后面会有它们的对应图。
6.字符流的输入与输出的对应
7.字符流与字节流转换
转换流的特点:
- 其是字符流和字节流之间的桥梁
- 可对读取到的字节数据经过指定编码转换成字符
何时使用转换流?
- 当字节和字符之间有转换动作时;
- 流操作的数据需要编码或解码时。
具体的对象体现:
- InputStreamReader:字节到字符的桥梁
- OutputStreamWriter:字节到字符的桥梁
这两个流对象是字符体系中的成员,它们有转换作用,本身又是字符流,所以在构造的时候需要传入字节流对象进来。
8.File类
File类是对文件系统中文件以及文件夹进行封装的对象,可以通过对象的思想来操作文件和文件夹。 File类保存文件或目录的各种元数据信息,包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名,判断指定文件是否存在、获得当前目录中的文件列表,创建、删除文件和目录等方法。
9.RandomAccessFile类
该对象并不是流体系中的一员,其封装了字节流,同时还封装了一个缓冲区(字符数组),通过内部的指针来操作字符数组中的数据。 该对象特点:
- 该对象只能操作文件,所以构造函数接收两种类型的参数:a.字符串文件路径;b.File对象。
- 该对象既可以对文件进行读操作,也能进行写操作,在进行对象实例化时可指定操作模式(r,rw)
该对象在实例化时,如果要操作的文件不存在,会自动创建;如果文件存在,写数据未指定位置,会从头开始写,即覆盖原有的内容。 可以用于多线程下载或多个线程同时写数据到文件。
NIO
从JKD 1.4 以后,旧的io包已经使用nio重新实现过,即使不显示的使用nio,也能提高速度。速度的提高在于所使用的结构更加接近于操作系统执行io的方式:通道和缓冲器。唯一直接与通道交互的缓冲器是ByteBuffer..
有三个类被修改产生通道FileChannel. 分别为 FileinputStream,FileoutputStream,RandomAccessFile.
import java.io.*;
import java.nio.*;
import java.nio.channels.*;
public class ChannelCopy {
private static final int BSIZE = 1024;
public static void main(String[] args) throws Exception {
if(args.length != 2){
System.out.println("arguments : sourcefile destfile");
System.exit(1);
}
// 打开一个FileChaanel用于读(输入)
FileChannel in = new FileInputStream(args[0]).getChannel();
// 打开一个FileChannel用于写(输出)
FileChannel out = new FileOutputStream(args[1]).getChannel();
// 一个缓冲器,分配了BSIZE个字节
ByteBuffer buffer = ByteBuffer.allocate(BSIZE);
/*
* return The number of bytes read, possibly zero, or <tt>-1</tt> if the channel has reached end-of-stream
* FileChanel.read()
* */
// -1 一个分界符(源于Unix和C),表示到达了输入的末尾
while(in.read(buffer) != -1){
buffer.flip(); // Prepare for writing
out.write(buffer);
// write()操作之后,信息仍在缓冲器中,clear()操作对所有的内部指针重新安排,以便缓冲器在另一个read()操作期间能够做好接受数据的准备。
buffer.clear(); // Prepare for reading
}
}
}
1. flip():反转此缓冲区,将限制设置为当前位置,然后将位置设置为0
2. rewind():返回到数据开始部分,与flip()不同,不会修改限制位置。
3. FileChannal.read():返回-1表示我们已经到达了输入的末尾。
4. flip()是准备缓存器,以便他的信息可以由write()提取。write()操作之后,信息仍在缓冲器中,接着clear()操作则对所有的内部指针重新安排,以便缓冲器在另一个read()操作期间能够做好接收数据的准备
转换数据
ByteBuffer类中有 asCharBuffer(),asIntBuffer,asShortBuffer等方法返回一个具体的CharBuffer,IntBuffer,ShortBuffer等。可以调用他们的put方法放入char字符等。还需要用到java.nio.charset.Charset类来为字符进行编码和解码。可以通过ByteBuffer类调用getFloat等方法来获取Float类型的数据。
视图转换器
视图缓冲器(view buffer)可以让我们通过某个特定的基本数据类型的视窗查看其底层的ByteBuffer。ByteBuffer依然是实际存储数据的地方,“支持”着前面的视图,因此对视图的任何修改都会映射成为对ByteBuffer中数据的修改。
方法
1. hasRemaining()
2. position()
字节存放次序
1. 两只方式:
1. 大端:将最重要的字节存放在地址最低的存储器单元——正常顺序
2. 小端:将最重要的字节存放在地址最高的存储器单元
2. 可以使用带有参数ByteOrder.BIG_ENDIAN或ByteOrder.LITTLE_ENDIAN方法改变ByteBuffer的字节排序方式。
3. 使用array()方法显示视图底层的字节,此方法是“可选的”,只能对有数组支持的缓冲器调用此方法。
用缓冲器操纵数据
1. ByteBuffer是将数据移进移除通道的唯一方式,并且我们只能创建一个独立的基本类型缓冲器,或者使用“as”方法从ByteBuffer中获得。即,我们不能把基本类型的缓冲器转换成ByteBuffer,但是我们可以经由视图缓冲器将基本类型数据移进移出ByteBuffer
2. 例如:如果想把一个字节数组放到文件中,先将字节数组包装起来(使用ByteBuffer.wrap()),在用getChannal()方法在FileOutputStream上开一个通道,接着将来自于ByteBuffer的数据写到FileChannal中。
缓冲器的细节
1. Buffer由数据和可以高效的访问及操纵这些数据的四个索引组成,这四个索引是:mark(标记), position(位置), limit(界限), capacatiy(容量).在缓冲器中插入或者提取数据会更新这些索引,用于反映发生的变化。
2. 下面是用于设置和复位索引以及查询它们的值的方法。
一旦调用缓冲器上相对的get()和put()方法,position指针会随之发生相应的改变。
当调用包含一个索引参数的get()和put()方法(参数指明方法发生的位置)。但是,这些方法不会改变position的位置。
reset():把position的值设为mark的值。
rewind():调用之后缓冲器的状态——返回到数据开始部分(position),与flip()不同,不会修改限制位置(limit)。
内存映射文件
1. 内存映射文件允许我们创建和修改哪些因为太大而不能放入内存的文件。
2. 有了内存映射文件,我们可以假定整个文件都放在了内存中,而且可以完全把他当作非常大的数组来访问。
3. 例子
MappedByteBuffer out = new RandomAccessFile("test.dat", "rw").getChannel().map(FileChannal.MapMode.READ_WRITE, 0, length);
4. 调用map()产生MappedByteBuffer(继承ByteBuffer而来),这是一种特殊类型的直接缓冲器。
注:我们必须指定映射文件的初始位置和映射区域的长度——我们可以映射某个大文件的较小部分
5. 性能:“映射文件访问”往往可以更加显著的加快速度。
6. System.namoTime()——得到系统时间
7. 映射文件中的所有输出必须使用RandomAccessFile.
文件加锁
1. 允许我们同步访问某个作为共享资源的文件。竞争同一个文件的两个线程可能在不同的java虚拟机上,或者一个是java线程,一个是操作系统中其他的某个本地线程。文件锁对其他的操作系统进程是可见的,因为java的文件加锁直接映射到了本地操作系统的加锁工具
2. 通过对FileChannel调用tryLock()或lock(),就可以获得整个文件的FileLock。(SocketChannal,DatagramChannal,ServerSocketChannal不需要加锁,因为他们是从单进程实体继承而来,我们通常不在两个进程之间共享网络)
1. tryLock(long position, long size, boolean shared):是非阻塞式的,它设法获取锁,但是如果不能获得(当其他一些进程已经持有相同的锁,并且不共享锁),它将直接从方法调用返回
2. lock(long position, long size, boolean shared):是阻塞式的,他要阻塞进程直至锁可以获得,或调用lock()的线程中断,或调用lock()的通道关闭。
注:枷锁区域为:size-position,第三个参数指定是否共享锁。
3. 使用FileLock.release()可以释放锁。
4. 无参数的枷锁方法将根据文件尺寸的变化而变化,它会对整个文件进行加锁,甚至文件变大也是如此。
有参数的你将获得某一个区域上的锁,当文件增大时,区域之外的部分不会被锁定。
5. 锁的类型(共享或者独占)可以通过FileLock.isShared()进行查询。
6. 对共享或者独占锁的支持必须有底层的操作系统支持。
7. 对映射文件的部分加锁:对巨大的文件进行部分加锁,以便其他进程可以修改文件中未加锁的部分。例如:数据库。
8. ByteBuffer.slice():用于创建一个共享了原始缓冲区子序列的新缓冲区。新缓冲区的position值是0,而其limit和capacity的值都等于原始缓冲区的limit 和position的差值。slice()方法将新缓冲区数组的offset值设置为原始缓冲区的position值,然而,在新缓冲区上调用 array()方法还是会返回整个数组。
9. 如果有java虚拟机,它会自动释放锁,或者关闭加锁的通道,不过也可以显示的为FileLock对象调用release()释放锁。