在我的计算机上安装了192GB RAM,我在启动时由
Linux内核保留了大于4GB(硬件地址为0x100000000)的188GB RAM(mem = 4G memmap = 188G $4G).数据采集内核模块使用DMA将数据累积到用作环形缓冲区的大区域中.用户空间应用程序mmap将此环形缓冲区放入用户空间,然后从当前位置的环形缓冲区复制块,以便在它们准备好后进行处理.
使用memcpy从mmap的区域复制这些16MB块不会像我预期的那样执行.看起来性能取决于启动时保留的内存大小(以及后来mmap进入用户空间). http://www.wurmsdobler.org/files/resmem.zip包含实现mmap文件操作的内核模块的源代码:
module_param(resmem_hwaddr, ulong, S_IRUSR);
module_param(resmem_length, ulong, S_IRUSR);
//...
static int resmem_mmap(struct file *filp, struct vm_area_struct *vma) {
remap_pfn_range(vma, vma->vm_start,
resmem_hwaddr >> PAGE_SHIFT,
resmem_length, vma->vm_page_prot);
return 0;
}
和测试应用程序,实质上(删除检查):
#define BLOCKSIZE ((size_t)16*1024*1024)
int resMemFd = ::open(RESMEM_DEV, O_RDWR | O_SYNC);
unsigned long resMemLength = 0;
::ioctl(resMemFd,