原理
映射通俗将就是建立对应关系,内存映射及建立磁盘道内存之间的对应关系,但这里的内存是指进程逻辑地址空间,要映射的大小和映射到内存的大小是相同的。这种映射是一种逻辑关系,因为进程的逻辑地址是虚拟的并不是实际的物理地址因此在内存的映射过程中是没有数据拷贝的,磁盘文件只是逻辑上被放入到内存。
完成磁盘到内存逻辑地址的映射后,当进程操作映射的内存区域时,由于磁盘文件只是逻辑加载到内存因此在进行逻辑地址到物理地址的转换时会引起缺页中断,而映射的磁盘文件并不是被swap此时就会根据mmap的映射关系将映射的磁盘文件读到内存。
如果在mmap是物理内存不够用则会通过swap机制将暂时用不到的物理页面交换到硬盘上
MMAP的优点
一般情况下对一个文件的读写操作都需要进行数据的拷贝,磁盘--->内核--->用户空间。但用内存映射的方式进行读写操作,由于mmap会引起页面中断,会直接将磁盘文件拷贝到用户空间,这样就会比普通的读写操作少一次数据拷贝,这样mmap就能提高磁盘文件的读写速度。
测试
我们用mmap和read/write函数分别对文件进行读写操作,最后比较两种方式所用时间。
#include<unistd.h>
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<sys/time.h>
#include<fcntl.h>
#include<sys/mman.h>
#define MAX 10000
int main()
{
int i = 0;
struct timeval tv1, tv2;
int* testarray = (int*)malloc(sizeof(int) * MAX);
/*调用read/write函数完成测试*/
gettimeofday(&tv1, NULL);
fd = open("test.txt", O_RDWR);
if (MAX != read(fd, (void*)testarray, MAX))
{
printf("读取文件失败/n");
return -1;
}
for (i = 0; i < MAX; ++i)
++testarray[i];
if (MAX != write(fd, (void*)array, MAX))
{
printf("写入文件失败/n");
return -1;
}
free(testarray);
close(fd);
gettimeofday(&tv2, NULL);
printf("调用read/write函数所用时间: %dms/n", tv2.tv_usec - tv1.tv_usec);
/*调用mmap函数完成测试*/
gettimeofday(&tv1, NULL);
fd = open("test.txt", O_RDWR);
array = mmap(NULL, MAX, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
for (i = 0; i < MAX; ++i)
++array[i];
munmap(array, MAX);
msync(testarray, MAX, MS_SYNC);
free(array);
close(fd);
gettimeofday(&tv2, NULL);
printf("调用mmap函数所用时间: %dms/n", tv2.tv_usec - tv1.tv_usec);
return 0;
}
得出结果为 mmap:151ms read/write:70ms
由此可看出用mmap对文件进行读写操作的速度比传统读写操作快将近一倍。因此在一些分布式文件系统当中也用mmap做内存映射以提高对文件的访问速度。