操作系统IO过程与零拷贝

咕噜咕噜崩

已于 2023-10-16 22:48:38 修改

阅读量517

点赞数 1

分类专栏：操作系统文章标签： linux 网络运维

于 2021-12-12 17:10:11 首次发布

本文链接：https://blog.csdn.net/weixin_47251999/article/details/121889255

版权

9 篇文章 0 订阅

订阅专栏

南桥中的DMA控制器是个什么东西？

我们曾经在硬件基础知识中讲过：CPU直接从磁盘/网卡中读/写取数据到内核（操作系统）缓冲区【磁盘高速缓存（PageCache）】会降低CPU效率，而这个工作CPU会交给南桥中的DMA控制器完成的。

syscall.Read(fd int, p []byte)
syscall.Write(fd int, p []byte)

四次数据拷贝：

在数据传输的场景中，用户并不会对数据进行「再加工」，所以没必要将数据拷贝到用户缓冲区。针对这个问题，产生一种技术：零拷贝

零拷贝技术实现的方式通常有 2 种：

系统调用：

syscall.Mmap(fd int, offset int64, length int, prot int, flags int)
syscall.Write(fd int, p []byte)

mmap() 系统调用函数会直接把内核缓冲区里的数据「映射」到用户空间，这样，操作系统内核与用户空间就不需要再进行任何的数据拷贝操作。

在这里插入图片描述

具体过程如下：

我们可以得知，通过使用 mmap() 来代替 read()，可以减少一次数据拷贝的过程。

在 Linux 内核版本 2.1 中，提供了一个专门发送文件的系统调用函数 sendfile()，函数形式如下：

syscall.Sendfile(outfd int, infd int, offset *int64, count int)

从 Linux 内核 2.4 版本开始起，对于支持网卡支持 SG-DMA 技术的情况下， sendfile() 系统调用更高效了：

通过 DMA 将磁盘上的数据拷贝到内核缓冲区里；
缓冲区描述符和数据长度传到 socket 缓冲区，这样网卡的 SG-DMA 控制器就可以直接将内核缓存中的数据拷贝到网卡的缓冲区里，此过程不需要将数据从操作系统内核缓冲区拷贝到 socket 缓冲区中，这样就减少了一次数据拷贝.

Kafka 这个开源项目，就利用了「零拷贝」技术，从而大幅提升了 I/O 的吞吐率，这也是 Kafka 在处理海量数据为什么这么快的原因之一。

Nginx 也支持零拷贝技术，一般默认是开启零拷贝技术，这样有利于提高文件传输的效率，是否开启零拷贝技术的配置如下：

http {
...
    sendfile on
...
}

「内核缓冲区」实际上是磁盘高速缓存（PageCache）
PageCache 的优点主要是两个：

关注