2024年最新清华老师带你彻底了解 Linux 文件系统初探

int (*symlink) (struct inode *,struct dentry *,const char *); //为符号链接创建一个inode

int (*mkdir) (struct inode *,struct dentry *,int); //为目录项创建一个inode

int (*rmdir) (struct inode *,struct dentry *); //为目录项删除一个inode

int (*mknod) (struct inode *,struct dentry *,int,dev_t); //建立一个目录项和一个特殊文件的对应索引节点

}

目录项对象

  • VFS 把每个目录看作一个文件,如在路径/tmp/test中, tmp 和 test 都是文件, tmp 是目录文件,而 test 是普通文件, tmp 和 test都有一个 inode 对象表示。

  • 每一个文件除了有一个 inode 数据结构外,还有一个 dentry 数据结构与之关联,该结构中的 d_inode 指针指向相应的 inode 结构。

  • dentry 数据结构可以加快对文件的快速定位,改进文件系统的效率。

  • dentry 描述文件的逻辑属性,它在磁盘上没有对应的映像; inode 结构记录文件的物理属性,在磁盘上有对应的映像。

struct dentry {

atomic_t d_count; //目录引用计数

unsigned int d_flags; //目录项状态标志

spinlock_t d_lock; //目录自旋锁

int d_mounted; //是否为安装点目录项

struct inode *d_inode; //目录项所在的Indoe节点

struct hlist_node d_hash; //目录项形成的hash表

struct dentry *d_parent; //父目录的目录项对象

struct qstr d_name; //目录项名字,用于快速查

struct list_head d_lru; //未使用的LRU双向链表

union {

struct list_head d_child; //父目录的子目录形成的双向链表

struct rcu_head d_rcu;

} d_u;

struct list_head d_subdirs; //该目录项的子目录的双向链表

struct list_head d_alias; //inode别名的链表

unsigned long d_time; //重新生效时间

const struct dentry_operations *d_op; //操作目录项的函数集

struct super_block *d_sb; //指向文件的超级快

void *d_fsdata; //文件系统特殊数据

unsigned char d_iname[DNAME_INLINE_LEN_MIN]; //文件名前15个字符

};

struct dentry_operations {

int (*d_revalidate)(struct dentry *, struct nameidata *); //判断目录是否有效

int (*d_hash) (struct dentry *, struct qstr *); //生成散列值

int (*d_compare) (struct dentry *, struct qstr *, struct qstr *); //比较两个文件名

int (*d_delete)(struct dentry *); //删除d_couny为0的目录项对象

void (*d_release)(struct dentry *); //释放一个目录项对象

void (*d_iput)(struct dentry *, struct inode *); //丢弃目录项对应的Indoe

};

文件对象

  • 文件对象在磁盘上没有映像,在文件被打开时创建由一个 file 结构组成。

  • 文件对象中的信息主要是文件指针,即文件中当前的位置,下一个操作将在该位置发生。

  • file 结构除保存文件当前位置外,还把指向该文件 inode 的指针放在其中,并形成一个双项链表,称系统打开文件表

struct file {

union {

struct list_head fu_list; //文件对象链表

struct rcu_head fu_rcuhead;

} f_u;

struct path f_path; //

const struct file_operations *f_op; //文件操作函数集

spinlock_t f _lock; /* f_ep_links, f_flags, no IRQ */

atomic_long_t f_count; //文件对象引用计数

unsigned int f_flags;

fmode_t f_mode; //操作文件模式

loff_t f_pos; //当前文件位置

struct fown_struct f_owner;

const struct cred *f_cred;

struct file_ra_state f_ra;

u64 f_version;

/* needed for tty driver, and maybe others */

void *private_data;

struct address_space *f_mapping;

}

struct file_operations {

struct module *owner;

loff_t (*llseek) (struct file *, loff_t, int); //修改文件指针

ssize_t (*read) (struct file *, char __user *, size_t, loff_t *); //从文件的偏移处写入若干字节

ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *); //向文件指定偏移处处写入若干字节

ssize_t (*aio_read) (struct kiocb *, const struct iovec *, unsigned long, loff_t);//以异步方式从文件的偏移处 读出若干字节

ssize_t (*aio_write) (struct kiocb *, const struct iovec *, unsigned long, loff_t);//以异步方式向文件指定偏移 处写入若干字节

int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);//向硬设备发送命令

int (*flush) (struct file *, fl_owner_t id); //关闭文件时刷新文件

I int (*release) (struct inode *, struct file *); //释放文件对象

int (*fsync) (struct file *, struct dentry *, int datasync); //将文件在缓存的数据写回磁盘

与文件相关


根据文件系统所在的物理介质和数据在物理介质上的组织方式来区分不同的文件系统类型的。 file_system_type 结构用于描述具体的文件系统的类型信息。被 Linux 支持的文件系统,都有且仅有一 个 file_system_type 结构而不管它有零个或多个实例被安装到系统中。

struct file_system_type {

const char *name; /文件系统的名字/

struct subsystem subsys; /sysfs子系统对象/

int fs_flags; /文件系统类型标志/

/在文件系统被安装时,从磁盘中读取超级块,在内存中组装超级块对象/

struct super_block *(get_sb) (struct file_system_type,

int, const char*, void *);

void (*kill_sb) (struct super_block *); /终止访问超级块/

struct module *owner; /文件系统模块/

struct file_system_type * next; /链表中的下一个文件系统类型/

struct list_head fs_supers; /具有同一种文件系统类型的超级块对象链表/

};

每当一个文件系统被实际安装,就有一个 vfsmount 结构体被创建,这个结构体对应一个安装点。

struct vfsmount

{

struct list_head mnt_hash; /散列表/

struct vfsmount *mnt_parent; /父文件系统/

struct dentry *mnt_mountpoint; /安装点的目录项对象/

struct dentry *mnt_root; /该文件系统的根目录项对象/

struct super_block *mnt_sb; /该文件系统的超级块/

struct list_head mnt_mounts; /子文件系统链表/

struct list_head mnt_child; /子文件系统链表/

atomic_t mnt_count; /使用计数/

int mnt_flags; /安装标志/

char *mnt_devname; /设备文件名/

struct list_head mnt_list; /描述符链表/

struct list_head mnt_fslink; /具体文件系统的到期列表/

struct namespace *mnt_namespace; /相关的名字空间/

};

与进程相关


  • 用户打开文件相关信息 files_struct

  • 进程的当前的工作目录和根目录的相关信息 fs_struct

struct task_struct {

struct fs_struct *fs; /文件系统信息/

struct files_struct *files; /当前打开的文件信息/

};

文件描述符 fd 用来描述打开的文件,每个进程用一个 files_struct 结构来记录文件描述符的使用情况,这个结构称为用户打开文件表。指向该结构的指针被用来保存在进程的 task_struct 结构的成员 files 中。

struct files_struct {

atomic_t count; //共享该表的进程数

struct fdtable *fdt; //文件描述符指针,指向fdtab

struct fdtable fdtab; //文件描述符表

spinlock_t file_lock ____cacheline_aligned_in_smp; //保护该结构的锁

int next_fd; //下一个空闲fd

struct embedded_fd_set close_on_exec_init; //执行exec函数时需关闭的文件描述符初始集

struct embedded_fd_set open_fds_init; //文件描述符初始集

struct file * fd_array[NR_OPEN_DEFAULT]; //指向文件对象的初始化指针数组

};

fd是指向文件对象的指针数组的指针,数组的长度存放在 max_fdset 域中。通常,fd 域指向 files_struct 结构的 fd_array 域,该域包含 NR_OPEN_DEFAULT (默认值为32)个文件对象指针。如果进程打开的文件数目大于 NR_OPEN_DEFAULT, n 内核分配一个新的文件指针数组,并将其地址存放在 fd 域中,同时更新 max_fds 域的值。

struct fdtable {

unsigned int max_fds; //进程当前具有的最大文件数

struct file ** fd; //指向文件对象(系统打开文件表项)的指针数组

fd_set *close_on_exec; //指向执行exec()函数时需关闭的文件描述符

fd_set *open_fds; //指向打开文件的描述符的指针

struct fdtable *next; //指向下一个描述表

};

对于在fd数组中有入口地址的每个文件来说,数组的下标就是文件描述符。通常,数组的第一个元素(索引为0)、第二个元素(索引为1)、第三个元素(索引为2)分别表示标准输入文件、标准输出文件、和标准错误文件,且这三个文件通常从父进程处继承而来。通过适当的系统调用,两个文件描述符可以指向同一个打开的文件,亦即数组的两个元素可以指向同一个文件对象。

为了进行文件查找,每个进程都有一个当前工作目录和当前工作目录所在文件系统根目录。

struct fs_struct { //建立进程与文件系统的关系

atomic_t count; /结构的使用计数/

rwlock_t lock; /保护该结构体的锁/

int umask; /默认的文件访问权限/

struct dentry * root; /根目录的目录项对象/

struct dentry * pwd; /当前工作目录的目录项对象/

struct dentry * altroot; /可供选择的根目录的目录项对象/

struct vfsmount * rootmnt; /根目录的安装点对象/

struct vfsmount * pwdmnt; /当前工作目录的安装点对象/

struct vfsmount * altrootmnt; /可替换的根目录的安装点对象/

};

Linux文件系统逻辑结构


磁盘与文件系统


路径查找


基本说明

文件的打开操作在内核中的实现思路很简单:即通过用户态传递的路径逐项查找文件;如果该文件存在,那么内核将为该文件创建 file 结构;同时将该 file 结构与 files 数组关联,最终返回数组的索引作为用户态的文件描述符。

路径查找是对给定的文件路径以目录项为单位进行逐级解析。主要包括以下几项内容:

  1. 确定路径查找的起始位置。比如,起始位置可能是current->fs->cwdcurrent->fs->root

  2. 当前进程是否有对目录项关联的 inode 进行访问的权限;

  3. 根据当前的目录项,对下一级目录项进行查找;这里的查找可能是向下查找子文件,也可能是向上反查父目录(比如下一级目录项为“…”);

  4. 处理挂载点问题;当前目录项如果是挂载点,那么必须处理不同文件系统之间的跨越;

  5. 处理符号链接文件:如果当前目录项为一个符号链接文件,那么必须追随(follow)该文件所指向的真实文件;

  6. 查找并创建文件路径中所缺失的部分;比如,通过 open() 创建一个新文件时,那么所传递的路径中可能有部分目录项当前是不存在的;

其中,第1项是路径查找的首要工作;2~6项是在路径查找过程中,针对每个目录项进行检查确认的。

负责 open 系统调用基本实现的是 do_sys_open() ,其内部所调用的 do_filp_open 函数承担了大部分 open 的实现过程,其中就包括路径查找。

sys_open()函数时序图

  • 首先,get_unused_fd_flags() 得到一个可用的文件描述符;通过该函数,可知文件描述符实质是进程打开文件列表中对应某个文件对象的索引值;

  • 接着,do_filp_open() 打开文件,返回一个 file 对象,代表由该进程打开的一个文件;进程通过这样的一个数据结构对物理文件进行读写操作。

  • 最后,fd_install() 建立文件描述符与 file 对象的联系,以后进程对文件的读写都是通过操纵该文件描述符而进行。

path_init()

用于设置路径搜寻的起始位置,主要体现在设置nd变量

如果 flags 设置了 LOOKUP_ROOT 标志,则表示该函数被 open_by_handle_at 函数调用,该函数将指定一个路径作为根;这属于特殊情况,这里暂不分析;接下来 path_init 主要分三种情况设置 nd 。

  1. 如果路径名 name 以/为起始,则表示当前路径是一个绝对路径,通过 set_root 设置 nd ;否则,表示路径 name 是一个相对路径;

  2. 如果 dfd 为 AT_FDCWD ,那么表示这个相对路径是以当前路径 pwd 作为起始的,因此通过pwd设置 nd ;

  3. 如果 dfd 不是 AT_FDCWD ,表示这个相对路径是用户设置的,需要通过 dfd 获取具体相对路径信息,进而设置 nd ;

上述步骤2和3都表示要打开的文件路径是以相对路径为起始的,但是两者稍有不同。步骤2为我们通常默认的 open 操作,而步骤3具体指的是 openat 系统调用,这一点体现在不同打开系统调用向 do_sys_open 中 dfd 参数所传递的值。

不管上述哪一种打开情况,均要设置 nd 变量,它是一个 nameidata 类型。在 path_init 中,nd 的 last_type 都被默认设置成了 LAST_ROOT 。

在 path_init 中,如果为上述步骤1,则通过当前进程的fs->root字段更新 nd 的 root 字段,并且 nd 的 path 字段也指向 root 字段;如果为步骤2,则通当前进程fs->pwd更新 nd 的 path 字段;如果为步骤3,则先通过文件描述符 dfd 获取用户指定的工作目录 file 结构,然后通过 file 的 f_path 字段更新 nd 的 path 字段。需要注意的是,步骤2和步骤3均未设置 root 字段。 最终,nd 中的 inode 字段均由path.dentry->d_inode更新。

link_path_walk

link_path_walk() 主要用于对各目录项逐级遍历。其函数声明如下:

static __always_inline int link_path_walk(const char *name, struct nameidata *nd)

该函数核心部分是通过一个循环完成的。在进入这个循环之前,如果路径name是一个绝对路径,那么该函数还对路径进行了一些处理,即过滤掉绝对路径/前多余的符号/。

在循环中,所要做的工作包含如下:

最全的Linux教程,Linux从入门到精通

======================

  1. linux从入门到精通(第2版)

  2. Linux系统移植

  3. Linux驱动开发入门与实战

  4. LINUX 系统移植 第2版

  5. Linux开源网络全栈详解 从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值