零拷贝
来自于原来 8 张图,就可以搞懂「零拷贝」了 - 小林coding - 博客园 (cnblogs.com),自己稍微删减了点内容,主要为了面试
1、为什么要有DMA技术
DMA技术的出现主要是为了优化I/O过程,在没有DMA技术前,I/O的过程如下图:
使用DMA后,可以替代CPU,将数据从磁盘中读取出来,再将磁盘缓冲区中的数据拷贝到内核缓冲区,之后再由CPU从内核缓冲区拷贝到用户缓冲区,具体流程如下:
2、传统的文件传输
传统的文件传输通常使用以下两个系统调用:
read(file,tmp_buf,len);
write(socket,tmp_buf,len);
过程如下:
其中发生了四次拷贝,两次DMA拷贝,两次CPU拷贝,同时还包含四次上下文切换,这大大降低了文件传输的效率。
3、如何优化传统文件传输
-
减少用户态与内核态的上下文切换
因为在读取磁盘数据的时候,用户态没有权限操控网卡和磁盘,所以需要进行系统调用,进入内核态,才有权限访问,所以需要减少系统调用的次数,从而来减少切换。
-
减少数据拷贝的次数
单纯的文件传输,是没有必要拷贝到用户的缓冲区的,因为我们不需要对数据进行再加工,所以可以取消用户缓冲区的拷贝过程。
4、如何实现零拷贝
实现零拷贝的两种方式:
- mmap+write
- sendfile
4.1 mmap+write
mmap系统调用函数能将内核缓冲区里的数据直接映射到用户空间,使用mmap来替代read操作,可以减少一次从内存缓冲区到用户缓冲区的拷贝,之后再使用write操作,能将内核缓冲区的数据拷贝到socket缓冲区,具体流程如下:
可见整体流程减少了一次拷贝,但是仍然需要四次的上下文切换
4.2 SendFile
SendFile是linux中专门用于发送文件传输的函数,其声明如下:
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);
这个函数可以替代read和write函数,所以就可以减少一次系统调用,并且其可以直接把内核缓冲区的数据拷贝到Socket缓冲区,这样就只有2次上下文切换和3次数据拷贝,具体过程如下图:
在LInux2.4版本后,SendFile函数调用过程发生了变化,其还是先将磁盘文件拷贝到内核缓冲区,但接下来其会将缓冲区描述符和数据长度传到Socket缓冲区,最后SG-DMA控制器就会直接将内核缓冲中的数据拷贝到网卡的缓冲区,又减少了一次数据拷贝,具体流程如下:
这就是零拷贝技术,全程都是通过DMA来搬运数据,CPU没有参与其中。