零拷贝

最新推荐文章于 2024-08-25 09:39:59 发布

lqadam

最新推荐文章于 2024-08-25 09:39:59 发布

阅读量1.4k

点赞数 4

分类专栏：操作系统概念 linux Java 知识文章标签：零拷贝

本文链接：https://blog.csdn.net/lqadam/article/details/85010781

版权

Java 知识同时被 3 个专栏收录

43 篇文章 0 订阅

订阅专栏

操作系统概念

15 篇文章 3 订阅

订阅专栏

linux

4 篇文章 0 订阅

订阅专栏

今日看rocketMQ的设计，读到如何提高broker的发送性能，看到了使用mmp(文件内存映射)的技术，零拷贝，提高了数据从文件到内存再到网络的传输效率。这里有点迷糊，所以详细google了一把。特写下来留作记录。

内容都是来自于已有的东西，都放到后文的参考文档里面，参考文档比我详细多了，有图有解释，有理论，甚至有代码，如果能看参考文档的原文的话，建议看原文。

概念澄清

“零拷贝”：在整个发送数据过程中，数据的复制是必不可少的，这里数据复制分两种类型，一种是CPU参与的一个字节一个字节处理的数据复制，一个是CPU不用参与，通过专有硬件DMA参与的，批量数据复制。自然，不用CPU参与的数据复制性能高。而“零拷贝”所说的拷贝，其实指的是，减少CPU参与的数据拷贝，最好减少到零次，但是各种实现方式里，很多种都只是减少一次两次，并没有直接让CPU参与的数据复制数归零。

为什么要多次拷贝

首先，操作系统是分用户内存空间和内核内存空间的，区分的原因是因为，很多操作系统的指令，安全级别很高，不是随随便便就能调用的，对应的，一部分归操作系统使用的内存空间安全级别也很高，不是随随便便就能访问的，二者都是操作系统才能操作的“内核态”。“内核态”的指令，叫做系统调用，“内核态”的内存空间，成为内核空间。

从硬盘读文件的过程，然后通过网络发送出去，一般的操作，需要经过：

拷贝流程

用户空间->(1. 读文件，系统调用，硬盘文件从硬件缓存复制到内核空间，使用DMA)->内核空间->(2. 用户程序读取文件数据，使用CPU)->用户空间->(3. 通过socket发送文件到网络，系统调用，数据复制回内核空间socket关联的内存，使用DMA)->内核空间->(4. 数据复制到网卡驱动硬件的缓存，系统调用，使用DMA，执行完成).

这样三次切换。更具体和形象的流程，请看参考文档的第一个，里面对这个过程，以及零拷贝优化后的过程，做了详细的图片说明。

每一次切换，数据都需要在内核空间和用户空间之间拷贝。在这个流程中，上述的2，3两步是不经过DMA，需要CPU参与的。

减少拷贝的方式

这里把理论思路和实现方式放到一起说。

mmp 文件内存映射

这是Java NIO实现的一个鼎鼎大名的做法，MappedByteBuffer。思路是将内核空间的数据和用户空间共享，进而减少上述流程中的第2步，内核空间到用户空间的数据拷贝，但是第3步，复制到socket关联的内核空间还是需要的，也就是内核空间之间还要CPU参与，拷贝一次。但是在内核角度看，它不再需要向用户控件拷贝数据了。