java nio原理和使用_java nio原理

最新推荐文章于 2024-07-24 10:04:54 发布

liu'mei

最新推荐文章于 2024-07-24 10:04:54 发布

阅读量290

点赞数

文章标签： java nio原理和使用

本文链接：https://blog.csdn.net/weixin_31991991/article/details/114201905

版权

在2018年十月份的十多次面试中，几乎每一场面试都会nio，可见nio的重要性。每当面试官问到nio的时候，我都会从操作系统层面的IO多路复用说起，只要说的明白，一般这一关就算过了。

首先要搞清楚nio中n的含义。如果告诉别人n的意思是new，那就给人留下很不好的印象了，这里的n一般是被理解为non-blocking。传统的InputStream/OutputStream体系的读写操作都是阻塞的，为什么它们是阻塞的？这是因为当调用读写操作时，上层应用程序并不知道底层的socket缓冲区是否是就绪的，如果正好是就绪的，那么不会阻塞；如果不是就绪的，就会阻塞直到socket缓冲区就绪。一般情况下，socket写缓冲区大部分时间是就绪的，而读缓冲区由于没有数据到来而处于等待状态。

所以，阻塞和非阻塞的区别在于，阻塞IO在进行IO操作时可能需要阻塞等待，而非阻塞IO在进行IO操作时不需要等待。因为后者在进行IO操作时通过一定的机制得知底层socket已经准备就绪了，至于机制，别急，各位看官往下接着看。

这里谈到了阻塞非阻塞的概念，在IO中还有一个容易混淆的概念是同步和异步。上面说了传统InputStream/OutputStream体系是阻塞的，而nio是非阻塞的。注意这里并没有说nio是异步的，因为它本身就不支持异步。nio还需要再经过一层封装才能实现异步的功能，java中netty、nima都是封装nio实现异步的框架。

那么什么是异步，或者说同步和异步有什么区别呢？同步是指A对B发生调用时，直到B完成了操作才返回结果给A；而异步是指A对B发生调用时，B会马上返回一个状态给A，当B操作完成时，通过某种方式来通知A。写过前端js代码的同学肯定能对异步有比较好的理解，在前端js代码中经常会设置异步回调函数。这里的异步回调函数就是当前面的操作完成时能够得到通知，进而做后续的处理。所以，说到异步，总是离不开另一个词汇：回调。

言归正传，说回nio。nio中，面向开发人员的组件主要有三个：ByteBuffer、Channel、Selector。ok，先上一段nio的demo代码。

server端：

public class NioServerTest {

public static void main(String[] args) throws Exception {

Selector selector = Selector.open();

ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();

serverSocketChannel.configureBlocking(false);

serverSocketChannel.register(selector, SelectionKey.OP_ACCEPT);

serverSocketChannel.socket().bind(new InetSocketAddress("127.0.0.1", 3000));

while (true) {

int num = selector.select();

if (num > 0) {

Set set = selector.selectedKeys();

Iterator it = set.iterator();

while (it.hasNext()) {

SelectionKey sk = it.next();

if (sk.isAcceptable()) {

System.out.println("sk.isAcceptable()");

SocketChannel sc = serverSocketChannel.accept();

sc.configureBlocking(false);

sc.register(selector, SelectionKey.OP_READ);

} else if (sk.isReadable()) {

System.out.println("sk.isReadable()");

SocketChannel sc = (SocketChannel) sk.channel();

ByteBuffer byteBuffer = ByteBuffer.allocate(3);

sc.read(byteBuffer);

String s = new String(byteBuffer.array()).trim();

System.out.println(s);

sc.write(ByteBuffer.wrap(s.getBytes()));

} else if (sk.isWritable()) {

System.out.println("sk.isWritable()");

} else if (sk.isConnectable()) {

System.out.println("sk.isConnectable()");

}

it.remove();

}

client端：

public class NioClientTest {

public static void main(String[] args) throws Exception {

Selector selector = Selector.open();

SocketChannel sc = SocketChannel.open(new InetSocketAddress("127.0.0.1", 3000));

sc.configureBlocking(false);

sc.register(selector, SelectionKey.OP_READ | SelectionKey.OP_CONNECT);

while (true) {

int num = selector.select();

if (num > 0) {

Set set = selector.selectedKeys();

Iterator it = set.iterator();

while (it.hasNext()) {

SelectionKey sk = it.next();

if (sk.isAcceptable()) {

System.out.println("sk.isAcceptable()");

} else if (sk.isReadable()) {

System.out.println("sk.isReadable()");

SocketChannel sc2 = (SocketChannel) sk.channel();

ByteBuffer bb = ByteBuffer.allocate(256);

sc2.read(bb);

System.out.println(new String(bb.array()).trim());

} else if (sk.isWritable()) {

System.out.println("sk.isWritable()");

} else if (sk.isConnectable()) {

System.out.println("sk.isConnectable()");

}

it.remove();

}

sc.write(ByteBuffer.wrap(("hello world" + (int)(Math.random()*1000)).getBytes()));

Thread.sleep(1000L);

}

下面，我们来详细分析nio的ByteBuffer、Channel、Selector三个组件。

ByteBuffer

ByteBuffer可以理解为操作一段内存的工具类。Channel的数据读写都是通过ByteBuffer，而不像传统IO那样直接操作流。这也是nio和bio很重要的一个不同点，nio的读写是面向缓冲的，bio的读写则是面向流的。

其内部维护了一个字节数组和3个位置相关的变量：

final byte[] hb;

private int position =0;

private int limit;

private int capacity;

其使用步骤：调用put()写入数据，当需要读数据时，先flip()切换为读模式，然后就可以get()了。从position到limit表示数组中可以操作(读/写)的部分，当limit达到capacity时，就不能读/写了。如：初始状态limit==capacity，当put()时，position不断增加，直到limit。当flip()时，position变为0，limit变为之前position的位置，就变成读模式了，从position的位置开始读。ByteBuffer还提供了mark/reset来实现做标记，以便重复读。

ByteBuffer有多个实现类，用来实现便捷地操作不同基本类型的数据。另外，ByteBuffer根据操作的内存不同，可分为HeapByteBuffer和DirectByteBuffer。前者是在jvm的堆中分配一个数组，后者则是通过Unsafe.allocateMemory()来申请一块堆外内存，并保存内存地址，所有的操作都是通过计算内存地址然后做读写操作。ByteBuffer提供了便捷方法：wrap()、array()，前者是将字符串封装成ByteBuffer，后者是讲ByteBuffer导成字符串。后面会单独写文章详细介绍堆外内存的相关知识。

Channel

nio中Channel可以理解为是对Socket的封装，read、write、connect、bind都是非阻塞的，能够实现非阻塞主要是依赖不同操作系统支持的IO多路复用技术，如window下的IOCP、Linux下的Epoll、Mac下的KQueue。针对不同的操作系统，jvm做了不同的封装，在Mac下KQueue的操作是封装为KQueueSelectorImpl以及KQueueArrayWrapper。

Channel的实现类有四个：FileChannel、SocketChannel、ServerSocketChannel、DatagramChannel。在nio编程中常用的是SocketChannel、ServerSocketChannel，下面简单说下这两个。

SocketChannel负责客户端连接的读写。其读写操作都是通过ByteBuffer，写的时候先将数据写到ByteBuffer，再由ByteBuffer传递给内核，内核传递给网卡，最终由网卡发送出去。读则是先将socket缓冲区的数据经过内核放到ByteBuffer中，再由SocketChannel从ByteBuffer中读到数据。当Selector监听到读就绪时调用read，读已经是就绪的，可以一次读完并返回，如果没有读完会继续触发读就绪事件；写操作道理类似。

ServerSocketChannel负责服务端监听端口、接收客户端连接。它可以理解为封装了ServerSocket，它没有读写方法，只有bind()、accept()方法。bind()是封装了socket的bind、listen操作，bind做的事情是将socket和地址/端口绑定，listen的作用是监听端口，并提供参数设置全连接队列大小，默认50，全连接队列和三次握手的知识有关，有兴趣的可以自己去查查资料；accept()是去读全连接队列，如果没有socket连接到来就会阻塞，如果有则返回第一个。nio中通常使用Selector去监听是否有客户端连接到来，如果有连接就绪事件，应用程序就可以去accept()，这样就避免了accept时的阻塞。

SocketChannel和ServerSocketChannel都提供了open()来快速创建其实现类的实例。

Selector

Selector能够监听多个Channel的多种IO事件。只要将channel注册到Selector上，那么当channel有IO就绪事件到来时，Selector.select()就会返回就绪Channel的数量，接下来就可以通过selectedKey()拿到所有就绪的Channel，进而处理Channel。IO就绪事件分为4类：读就绪(OP_READ)、写就绪(OP_WRITE)、连接就绪(OP_CONNECT)、接收就绪(OP_ACCEPT)。

在mac os上，是用KQueueSelectorImpl作为Selector的实现类，它利用操作系统提供的KQueue模型，Selector.select()最终其实是调用KQueueArrayWrapper的poll()，后者返回就绪数量，并且会把就绪事件对应的socket的文件描述符放到一个指定的队列中，调用getDiscriptor(int i)可以得到队列中的某个元素，然后再根据返回的FD去找到对应的Channel(对应关系在Selector中维护)。

Selector重要的方法：wakeup、select、register

wakeup()：是通过操作系统的管道实现的。当创建一个Selector时，会同时创建一个管道，管道分为两头，一头是读的，一头是写的，将读的这头的socket信息注册到Selector中，当需要wakeup时，就往写的那头随便写一个字节就好了。

register()：，新建一个SelectionKeyImpl，然后向KQueueArrayWrapper的updateList添加一个元素，其中封装了channel和interestOps，当selector.select()时会一一取出updatelist中的Update，注册到kqueue事件，然后调用kevent0()去监听是否有就绪事件。

select()：，会去调用KQueueArrayWrapper的poll()，其中会将updateList中的Update一一注册kqueue事件，然后去调用kevent0()阻塞监听就绪事件。

要理解Selector的工作原理，光看代码是不够的，因为其中相关的类涉及到很多的本地方法调用，而大部分的人没有勇气也没有能力或者说精力去看JVM源码。要理解Selector的工作原理，其核心是要理解上面提到的IO多路复用模型。当明白了IO多路复用是怎么回事之后，猜也能猜到Selector的工作原理了。关于IO多路复用，网上有很多的资料，下面我们简单说下。

以Linux下的epoll为例，我们说说IO多路复用。

epoll模型中，有三个核心的系统调用：epoll_create、epoll_ctrl、epoll_wait

epoll_create：系统启动时分配内存，构造一棵红黑树。

epoll_ctrl：将一个socket信息和感兴趣的事件注册到红黑树中，并绑定一个回调函数，当内核收到该socket的相关IO事件就绪时，将socket信息写到一个列表中。

epoll_wait：读上面说到的那个列表

以上关于IO多路复用模型的描述忽略了很多东西，因为它不是本文要说的重点，而是结合nio说说nio如何通过IO多路复用模型来实现非阻塞的io调用。当调用register()时，其实就是将socket信息和感兴趣的事件注册到内核；selector.select()时阻塞去读上面说的那个列表，当列表有数据时，将读到的socket信息保存起来；read、write、accept都是selector.select()之后才会去执行的操作，因为此时socket缓存已经处于就绪状态了，自然不会阻塞了。