向磁盘写文件时,进程崩溃?
文件数据一开始是写入内核缓冲区(page cache),进程崩溃数据依旧在内核中,寻找时机将数据持久化到磁盘中。
page cache
由内核管理的内存区域,mmap和I/O都是在Page Cache中进行读或写操作
可访问的两种类型
文件备份页:将磁盘中的数据备份到Page Cache
匿名页:程序运行中临时分配的内存数据
Swap与缺页中断
操作系统以Page为单位管理内存,访问数据不在内存时,触发缺页中断,将数据以页的方式加载到内存中。
内存是有限的,当内存不足,通过置换算法进行换入换出。
替换文件备份页时,先判断是否为脏数据,是就加载到磁盘后再换出,否则直接换出
替换匿名页时,必须先将数据持久化到磁盘,再换出。
执行效率等级:
1.异步不阻塞释放内存
2.同步阻塞释放内存
3.MMO直接杀死进程来释放内存
Page Cache与buffer cache
P用于缓存文件的页数据,是逻辑上的概念与文件系统同级
B用于缓存块设备的块数据,是物理上的概念与块设备驱动程序同级
共同目的都是加速I/O:
1.写时先写到缓存中,标记为脏,最后向外部存储flush
2.读时,先读取缓存,未命中去外部存储读取
Page Cache与文件持久化的一致性
1.写回2.写直达
3.MESI协议:
1)已修改 2)独占 3)共享 4)已失效
Page Cache的优劣势
1.加速数据访问:
缓存到内存中,减少对磁盘的I/O次数
2.减少I/O次数,提高磁盘I/O吞吐量
通过缓存与预读能力,一次I/O装入多个page,减少磁盘I/O次数
劣势:
1.最直接缺点是占用额外物理内存空间,物理空间紧张时导致频繁调用swap操作
2.对应用层没有提供好的API接口
3.有些情况比直接I/O多读一次,比如大文件传输时,需要将数据缓存再读取,且数据基本没有复用性