linux 虚拟内存 mmap,linux – 使用mmap和大页面随机读取大文件

我正在使用mmap来读取一个大型数据库文件(例如,100GB),索引保存在主内存中(键偏移对).

由于默认的4KB虚拟内存页面大小,我假设文件系统上的读取调用也将使用4KB的块.但是,对于我的应用程序的访问模式来说,这是非常低效的.因此,我正在调查使用大页面透明地将I / O单元的大小从4KB增加到2MB的可能性.

大页面的典型用法似乎是提高内存分配和TLB利用率,但我找不到任何与实际文件I / O有关的信息.使用mmap,似乎只有私有匿名地图才支持大页面.这个假设是否正确?我也尝试过查看libhugetlbfs,但是无法找到我如何用它来读取实际文件.

那么,有没有办法透明地使用mmap访问文件并使用大于4KB的I / O单元?

解决方法:

Linux不支持使用具有页面缓存的大页面(与其他操作系统相同).

最重要的原因是页面缓存由系统中的每个进程和内核本身使用(共享).

请考虑以下情形:您的流程使用2MB大页面映射文件,但随后另一个流程使用常规4KB页面映射它.唯一的方法是动态地将进程切换到4KB页面,因此首先从2MB页面开始是没有意义的.

您实际需要的是要求内核使用带有FADV_WILLNEED的fadvise或带有MADV_WILLNEED的madvise来开始预取数据.做一个系统调用不是“免费”,但如果你知道你很快就要访问2MB区域,那么它们应该是完美的.

有关其他信息,请阅读this以更深入地了解内核开发人员对大页面的看法(思考).

标签:io,linux,mmap,memory-mapped-files,huge-pages

来源: https://codeday.me/bug/20190705/1391607.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值