1. 零拷贝的基本介绍
- 零拷贝是网络编程的关键,很多性能的优化都离不开。
- 在Java程序中,常用的零拷贝有mmap(内存映射)喝sendFile。
2. 传统的IO模型与零拷贝对比
2.1 传统的模型图
其中 DMA: direct memory access 直接内存拷贝(不适用CPU)
2.2 mmap 优化
- mmap示意图
mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样在进行网络传输的时候,就可以减少内核空间到用户空间的拷贝次数。
2.3 sendFile 优化
- 示意图
Linux2.1 版本提供了sendFile函数,其原理是:数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer ,同时,由于和用户态完全无关,就减少了上下文切换。 - 提示
零拷贝从操作系统的角度就是没有CPU拷贝。 - Linux在2.4的版本中做了修改,避免从内核缓冲区拷贝到Socket buffer的操作,直接拷贝到协议栈,从而再一次减少了数据拷贝。如下图:
这里其实有一次CPU拷贝,kernel buffer
->socket buffer
,但是拷贝的信息很少,比如length ,offset, 消耗低,可以忽略。
2.4 mmap 和 sendFile 的区别
- mmap 适合小数据读写,sendFile适合大文件的读写。
- mmap需要4此上下文切换,3次数据拷贝;sendFile需要3次上下文切换,最少2次数据拷贝。
- sendFile 可以通过DMA方式,减少CPU拷贝,mmap则不能(必须从内核拷贝到Socket缓冲区)。
2.5 零拷贝的再次理解
- 零拷贝是从操作系统的角度来说的,因为内核缓冲区之间,没有数据是重复的(只有kernel buffer 有一份数据)
- 零拷贝不仅仅带来更少的数据复制,还能带来其他性能优势,例如更少的上下文切换,更少的CPU缓存伪共享以及无CPU校验和计算。