NIO工作原理及零拷贝
NIO工作原理
NIO 非阻塞 网络编程相关的(Selector、SelectionKey、ServerSocketChannel和SocketChannel)关系梳理图:
图形说明:
- 客户端连接时,会通过ServerSocketChannel得到SocketChannel。
- Selector进行监听select()方法,返回有事件发生的通道的个数。
- 将SocketChannel注册到Selector上,register(Selector sel,int ops),一个selector上可以注册多个SocketChannel。
- 注册后返回一个SelectionKey,会和该Selector关联(集合)。
- 通过selectedKeys()进一步得到各个SelectionKey(有事件发生)。
- 然后通过SelectionKey反向获取SocketChannel。
- 通过方法channel(),得到channel,进一步得到channel相关的buffer获取到数据,进行业务处理,进行数据返回。
零拷贝
-
传统IO数据读写
1.1 Java传统IO和网络编程的一段代码
-
传统IO模型
Hard drive:硬盘
kernel buffer:内核
protocol engine:协议栈
DMA:direct memory access 直接内存拷贝(不使用CPU) -
mmap优化
3.1 mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样,在进行网络传输时,就可以减少内核空间到用户空间的拷贝次数。如下图:
-
sendFilr优化
4.1 Limux 2.1 版本提供了 sedFile 函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer,同时,由于和用户态完全无关,就减少了一次上下文切换:
4.2 提示: 零拷贝从操作系统角度,是没有 cpu 拷贝
4.3 Linux 在 2.4 版本中,做了一些修改,避免了从内核缓冲区拷贝到 Socket buffer 的操作,直接贝到协议栈从而再一次减少了数据拷贝。具体如下图和小结:
4.4 这里其实有 一次 cpu 拷贝kernel buffer -> socket buffer但是,拷贝的信息很少,比如 lenght,offset,消耗低,可以忽略。 -
零拷贝的真正含义
5.1 我们说零拷贝,是从操作系统的角度来说的。因为内核缓冲区之间,没有数据是重复的(只有 kermel buffer 有1一份数据)。
5.2 零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的 CPU 缓存伪共享以及无 CPU 校验和计算。 -
mmap和sendFile的区别
6.1 mmap 适合小数据量读写,sendFile 适合大文件传输。
6.2 mmap 需要 4 次上下文切换,3 次数据拷贝: sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
6.3 sendFile 可以利用 DMA 方式,减少 CPU 贝mmap 则不能(必须从内核贝到 Socket 缓冲区)。