linux内核文件一致性之被动一致性

最新推荐文章于 2022-02-10 21:59:37 发布

kai_ding

最新推荐文章于 2022-02-10 21:59:37 发布

阅读量1.8k

点赞数

分类专栏： vfs

本文链接：https://blog.csdn.net/kai_ding/article/details/9914655

版权

本文详细介绍了Linux内核中的被动一致性，即后台定期刷新文件的脏数据和元数据的实现。文章围绕管理线程、工作线程的架构，讨论了回写任务的创建、数据结构、回写流程以及如何处理设备的脏inode链表。通过分析，揭示了内核如何确保文件系统的一致性，并避免活锁等问题。

摘要由CSDN通过智能技术生成

前言

前一篇博客中我们仔细描述了Linux文件系统的主动一致性，即文件系统对外提供的用于实现文件一致性的接口，应用程序可以调用这些接口同步文件/系统的脏数据和元数据。但诚如前一篇博客中所说，一个成熟的系统不仅应该只有这些由用户控制的同步方式，系统需要提供一些方式来保证文件数据/元数据的一致性。本篇博客我们就详细描述Linux内核中这种被动一致性的实现框架以及部分细节。

思考

所谓被动一致性是指系统后台存在定期的任务刷新某些文件的脏数据以及元数据。稍加思索知道，这些定期任务应该以内核线程的形式出现，于是，这些后台线程在设计的时候存在如下问题需要解决：

需要创建多少个内核线程来完成同步任务，根据何种标准来确定线程数量？多线程采用何种架构，所有线程处于同等地位还是存在一个集中管理线程（类似lighthttp架构）？
多线程如何处理并行的问题？这个问题其实又和如何确定创建的线程数量息息相关。
内核线程作为被动地刷新脏文件，其执行流必然会和主动刷新并行执行，如何设计一个统一的框架来管理这些任务流地执行？

总体框架

针对上述思考中的各个问题，Linux内核采取了如下的解决办法：

创建的针对回写任务的内核线程数由系统中持久存储设备决定，操作系统中有N个存储设备，那么在系统初始化时就会为其创建N个刷新线程。
关于多线程的架构问题，Linux内核采取了Lighthttp的做法，即系统中存在一个管理线程和多个刷新线程（每个持久存储设备对应一个刷新线程）。管理线程监控设备上的脏页面情况，若设备一段时间内没有产生脏页面，就销毁设备上的刷新线程；若监测到设备上有脏页面需要回写且尚未为该设备创建刷新线程，那么创建刷新线程处理脏页面回写。而刷新线程的任务较为单调，只负责将设备中的脏页面回写至持久存储设备中。
刷新线程刷新设备上脏页面大致设计如下：

每个设备保存脏文件链表，保存的是该设备上存储的脏文件的inode节点。所谓的回写文件脏页面即回写该inode链表上的某些文件的脏页面。
系统中存在多个回写时机，第一是应用程序主动调用回写接口（fsync，fdatasync以及sync等），第二管理线程周期性地唤醒设备上的回写线程进行回写，第三是某些应用程序/内核任务发现内存不足时要回收部分缓存页面而事先进行脏页面回写，设计一个统一的框架来管理这些回写任务非常有必要。

图1 回写线程总体框架

图2 回写机理

需要特别注意的一点是：系统为每个设备创建一个回写线程，而不是每个磁盘分区创建一个回写线程。这就导致可能出现如下问题：图2中的脏inode链表中的inode可能并不属于同一个文件系统，因为每个文件系统可能会建立在设备的一个分区之上。

具体实现

回写流程

前面我们叙述了与被动（隐式）回写相关的数据结构，接下来我们就要思考回写流程到底该如何设计。

因为内核对回写采取了单管理线程+多工作线程的框架。因此，回写的流程分为管理线程设计和工作线程流程设计。

管理线程

对于管理线程来说，其主要工作是监视工作线程的运行状况，根据设备上的脏页面状况调整工作线程的运行，如设备上无脏页面且设备的工作线程已经有一段时间未被激活那么就kill该设备的回写线程，如果设备上有回写页面但尚未创建回写线程，那么为设备创建回写线程并启动线程运行。因此，总结来说，管理线程的主要流程如下：

遍历系统中所有的设备，判断设备目前的状态，如果设备脏inode链表不为空或者设备任务队列不为空且该设备当前尚未创建回写线程，那么为设备创建回写线程；如果设备当前脏inode链表为空且设备的回写线程已经有较长一段时间未活跃，那么就需要kill该设备的回写线程。当然，在对每个设备进行处理的过程中，是需要有很多细节问题需要考虑的。以下是管理线程的运行函数：

static int bdi_forker_thread(void *ptr)

{

struct bdi_writeback *me = ptr;

current->flags |= PF_FLUSHER | PF_SWAPWRITE;

set_freezable();

* Our parent may run at a different priority, just set us to normal

set_user_nice(current, 0);

//线程运行在一个大的循环之中

for (;;) {

struct task_struct *task = NULL;

struct backing_dev_info *bdi;

enum {

NO_ACTION, /* Nothing to do */

FORK_THREAD, /* Fork bdi thread */

最低0.47元/天解锁文章

kai_ding

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
linux内核文件一致性之被动一致性

前言前一篇博客中我们仔细描述了Linux文件系统的主动一致性，即文件系统对外提供的用于实现文件一致性的接口，应用程序可以调用这些接口同步文件/系统的脏数据和元数据。但诚如前一篇博客中所说，一个成熟的系统不仅应该只有这些由用户控制的同步方式，系统需要提供一些方式来保证文件数据/元数据的一致性。本篇博客我们就详细描述Linux内核中这种被动一致性的实现框架以及部分细节。思考
复制链接

扫一扫