mmap() vs. reading blocks (翻译)

最新推荐文章于 2022-04-29 11:25:58 发布

chrispink_yang

最新推荐文章于 2022-04-29 11:25:58 发布

阅读量277

点赞数

分类专栏：闲时翻译 linux 文章标签： linux mmap read IO StackOverflow

linux 同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

闲时翻译

1 篇文章 0 订阅

订阅专栏

原文地址:
mmap() vs. reading blocks

mmap vs read

在我试图为linux上的mmap/read的性能找到一个确切的答案的过程中, 我在linux内核邮件列表中发现了一篇精彩的文章(链接). 这已经是2000年的文章, 显然至今linux已经在内核区的IO和虚拟内存方面有了许多改进, 但是这篇文章依旧很好地解释了mmap和read的性能问题.

相比于read调用, 一次mmap调用的系统开销更大(正如epoll的开销要比poll更大). 在进程间改变虚拟内存的映射更是一个代价很大的操作, 因为进程间的切换本身就会消耗很大CPU资源. 但是你使用read读取一个文件, 因此read/write属于系统IO,都在内核区有磁盘缓存, 只要使用系统IO都会优先检查内核区的缓存.

但是通常来说, 提前使用mmap完成内存映射要比调用read时在磁盘做随机访问要快得多,特别是当你访问的对象在磁盘上分布地很分散.

内存映射允许你把页面保存在缓存当中,直到你完成对页面的操作. 也就是说, 你经过一段长时间地读写一个文件,然后关闭文件,再重新打开, 页面依然在缓存当中. 当你使用read调用时, 你的文件页面会在缓存当中老化,进而被系统清洗出缓存. 当然,如果你只是读写一个文件,然后马上丢弃它,没有耗时长的操作的话,你是感受不到缓存页面的老化的.
(如果你想通过mlock给内存页面加锁来防止页面被换出缓存,那相当于你想要比精心设计过的磁盘缓存机制表现得更聪明, 通常来说,这种蠢事几乎不可能提高系统性能.)

直接读取一个文件既简单又高效.

对于mmap/read的讨论让我想起了另外两个有关性能的讨论:
1) 通常来说,非阻塞IO其实比阻塞IO慢, 这使很多java程序员震惊. 但你只要知道了非阻塞IO需要更多的系统调用, 这就很好理解.
2) 通常来说, epoll其实比poll慢, 这使很多网络编程程序员震惊. 但你只要知道了管理epoll显然需要更多的系统调用,这就很好理解.