1. 缓冲区基本概念
- 缓冲区(Buffer):在java NIO中负责数据的存取。缓冲区就是数组,用于存储不同数据类型的数据
根据数据类型不同,提供了相应类型的缓冲区:
- ByteBuffer
- CharBuffer
- IntBuffer
- LongBuffer
- FloatBuffer
- DoubleBuffer
上述缓冲区的管理方式几乎一致,通过 allocate() 获取缓冲区
缓冲区存取数据的两个核心方法:
-
put():存入数据到缓冲区
put(byte b):将给定单个字节写入缓冲区的当前位置
put(byte[] src):将 src 中的字节写入缓冲区的当前位置
put(int index, byte b):将指定字节写入缓冲区的索引位置(不会移动 position)
-
get():获取缓冲区的数据
get() :读取单个字节
get(byte[] dst):批量读取多个字节到 dst 中
get(int index):读取指定索引位置的字节(不会移动 position)
缓冲区的四个核心属性
- capacity:容量,表示缓冲区中最大存储数据的容量。一旦声明不能改变。
- limit:界限,表示缓冲区可以操作数据的大小。(limit后面的数据不能进行读写)
- position:位置,表示缓冲区正在操作数据的位置
- mark:标记,表示记录当前position的位置,可以通过reset()恢复到mark标记的位置
0 <= mark <= position <= limit <= capacity
Buffer常用方法
方 法 | 描 述 |
---|---|
Buffer clear() | 清空缓冲区并返回对缓冲区的引用 |
Buffer flip() | 将缓冲区的界限设置为当前位置,并将当前位置充值为 0 |
int capacity() | 返回 Buffer 的 capacity 大小 |
boolean hasRemaining() | 判断缓冲区中是否还有元素 |
int limit() | 返回 Buffer 的界限(limit) 的位置 |
Buffer limit(int n) | 将设置缓冲区界限为 n, 并返回一个具有新 limit 的缓冲区对象 |
Buffer mark() | 对缓冲区设置标记 |
int position() | 返回缓冲区的当前位置 position |
Buffer position(int n) | 设置缓冲区的当前位置为 n , 并返回修改后的 Buffer 对象 |
int remaining() | 返回 position 和 limit 之间的元素个数 |
Buffer reset() | 将位置 position 转到以前设置的 mark 所在的位置 |
Buffer rewind() | 将位置设为为 0, 取消设置的 mark |
代码示例:
public static void main(String[] args) {
testBuffer();
testMark();
}
/**
* 测试buffer
*/
public static void testBuffer(){
// 1. 分配一个指定大小的缓冲区
ByteBuffer buf = ByteBuffer.allocate(1024);
System.out.println("------------allocate()--------------");
System.out.println(buf.position());
System.out.println(buf.limit());
System.out.println(buf.capacity());
//2. 利用put存入数据
String str = "abcde";
buf.put(str.getBytes());
System.out.println("------------put()--------------");
System.out.println(buf.position());
System.out.println(buf.limit());
System.out.println(buf.capacity());
//3. 切换到读取数据模式
buf.flip();
System.out.println("------------flip()--------------");
System.out.println(buf.position());
System.out.println(buf.limit());
System.out.println(buf.capacity());
//4. 读取数据
byte[] dst = new byte[buf.limit()];
buf.get(dst);
System.out.println(new String(dst,0,dst.length));
System.out.println("------------get()--------------");
System.out.println(buf.position());
System.out.println(buf.limit());
System.out.println(buf.capacity());
//5. rewind() 可重复读数据
buf.rewind();
System.out.println("------------rewind()--------------");
System.out.println(buf.position());
System.out.println(buf.limit());
System.out.println(buf.capacity());
// 6. clear() 清空缓冲区,但是缓冲区的数据依然存在,但是处于“被遗忘”状态
buf.clear();
System.out.println("------------clear()--------------");
System.out.println(buf.position());
System.out.println(buf.limit());
System.out.println(buf.capacity());
System.out.println((char)buf.get());
}
public static void testMark(){
// 1. 分配一个指定大小的缓冲区
ByteBuffer buf = ByteBuffer.allocate(1024);
String str = "abcde";
buf.put(str.getBytes());
buf.flip();
byte[] dst = new byte[1024];
buf.get(dst,0,2);
System.out.println(new String(dst,0,2));
System.out.println(buf.position());
//mark():标记
buf.mark();
buf.get(dst,2,2);
System.out.println(new String(dst,2,2));
System.out.println(buf.position());
//reset(),恢复到mark标记的位置
buf.reset();
System.out.println(buf.position());
//缓冲区是否有可操作的字节
if(buf.hasRemaining()){
//打印还有多少可操作的字节
System.out.println(buf.remaining());
}
}
2. 直接缓冲区与非直接缓冲区
2.1 直接缓冲区
直接缓冲区通过static ByteBuffer allocateDirect(int capacity)创建。创建的缓冲区,在JVM内存外开辟内存,在每次调用基础操作系统的一个本机IO之前或者之后,虚拟机都会避免将缓冲区的内容复制到中间缓冲区(或者从中间缓冲区复制内容),缓冲区的内容驻留在物理内存内,会少一次复制过程,如果需要循环使用缓冲区,用直接缓冲区可以很大地提高性能。虽然直接缓冲区使JVM可以进行高效的I/O操作,但它使用的内存是操作系统分配的,绕过了JVM堆栈,建立和销毁比堆栈上的缓冲区要更大的开销。
建议将直接缓冲区主要分配给那些易受基础系统的本机I/O操作影响的大型、持久的缓冲区。一般情况下,最好仅在直接缓冲区能在程序性能方面带来明显好处时分配它们。
直接字节缓冲区还可以通过 FileChannel 的 map() 方法 将文件区域直接映射到内存中来创建。 该方法返回MappedByteBuffer 。 Java 平台的实现有助于通过 JNI 从本机代码创建直接字节缓冲区。如果以上这些缓冲区中的某个缓冲区实例指的是不可访问的内存区域,则试图访问该区域不会更改该缓冲区的内容,并且将会在访问期间或稍后的某个时间导致抛出不确定的异常。
2.2 非直接缓冲区
非直接缓冲区static ByteBuffer allocate(int capacity)来创建。创建的缓冲区,在JVM中内存中创建,在每次调用基础操作系统的一个本机IO之前或者之后,虚拟机都会将缓冲区的内容复制到中间缓冲区(或者从中间缓冲区复制内容),缓冲区的内容驻留在JVM内,因此销毁容易,但是占用JVM内存开销,处理过程中有复制操作。
非直接缓冲区写入步骤:
1.创建一个临时的直接ByteBuffer对象。
2.将非直接缓冲区的内容复制到临时缓冲中。
3.使用临时缓冲区执行低层次I/O操作。
4.临时缓冲区对象离开作用域,并最终成为被回收的无用数据。
字节缓冲区是直接缓冲区还是非直接缓冲区可通过调用其 isDirect()方法来确定。提供此方法是为了能够在性能关键型代码中执行显式缓冲区管理。