sendfile()
Linux 内核版本 2.1 提供了一个专门发送文件的系统调用函数 sendfile(),主要用于以太网传输文件,函数形式如下:
#include <sys/socket.h>
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);
前2个参数分别是目的端和源端的文件描述符,后2个参数是源端的偏移量和复制数据的长度,返回值是实际复制数据的长度。
传统的网络数据发送流程使用read和write读取数据后发送,或将接收到的数据保存。其本质是将文件内容读取到内核后再拷贝到用户态,在用户态根据具体的指令,再次将数据转移到内核态并发送出去,这个过程经历了多次内存拷贝和上下文切换,十分耗费时间。
采用sendfile(),并配合DMA模块,可以减少数据拷贝时,CPU的参与次数,节省出cpu的时间,从而提高性能。使用sendfile()可以替代前面的 read() 和 write() 这两个系统调用,减少一次系统调用和 2 次上下文切换。另外,sendfile可以直接把内核缓冲区里的数据拷贝到 socket 缓冲区里,不再拷贝到用户态,优化后只有 2 次上下文切换,和 3 次数据拷贝。
实际上这样的方法在使用的过程中,还是会需要CPU参与数据拷贝,也并不是真正意义上的零拷贝。
真正实现零拷贝技术,需要网卡支持 SG-DMA 技术,查看网卡时候支持此技术的方法是
$ ethtool -k eth0 | grep scatter-gather
scatter-gather: on
这样流程变为,通过 DMA 将磁盘上的数据拷贝到内核缓冲区里;缓冲区描述符和数据长度传到 socket 缓冲区,这样网卡的 SG-DMA 控制器就可以直接将内核缓存中的数据拷贝到网卡的缓冲区里;
这里数据的转移完全不需要CPU的参与,即是“零拷贝”技术。