常规文件操作为了提高读写效率和保护磁盘,采用了页缓存机制:读文件时需要将文件页从磁盘拷贝到页缓存中,由于页缓存处于内核空间,不能被用户进程直接寻址,所以还需要将页缓存中的数据页再次拷贝到内存对应的用户空间中。这样,通过两次数据拷贝,才完成了进程对文件内容的获取任务。写操作也是一样,待写入的buffer在内核空间无法直接访问,必须先拷贝至内核空间对应的主存,再写回磁盘,也是需要两次数据拷贝。
mmap通过内存映射文件的方法,将一个文件或者其他对象映射到进程的地址空间,实现了文件磁盘地址和进程虚拟地址空间的一一映射关系。实现了这样的映射关系后,进程可以通过指针的方式读写操作这一段内存,而系统会自动回写到脏页面对应的文件磁盘上,即完成了对文件的操作而不必调用write、read等系统调用函数。