计算机的文件是一种存储和组织计算机数据的方法,是一套实现了数据的存储、分级组织、访问和获取等操作的抽象数据类型。
设备文件
设备文件与系统的某个设备相对应。在内核中,每种设备文件都有与之相对应的设备驱动程序,用来处理设备的所有I/O请求。
设备划分为两类:
- 字符型设备基于每个字符处理数据。终端和键盘
- 块设备每次处理一块设备。块的大小取决于设备类型。磁盘和磁带设备。
磁盘和分区
常规文件和目录通常放在硬盘设备里,通过硬盘驱动器中盘片的高速旋转和磁盘上快速移动的读/写磁头,来获取或修改磁盘表面的磁性编码信息。
fdisk -l 查看磁盘上的所有分区
cat /proc/partitions 记录每个磁盘分区的主辅设备编号,大小和名称
文件类型
Windows:
NTFS
FAT32
Linux:
EXT系列
文件系统结构
- 引导块:不为文件系统所用,只是包含用来引导操作系统的信息(双系统时用来引导)。
- 超级块:包含文件系统的 i 节点表容量,文件系统中逻辑块大小,以逻辑块计的文件系统大小。
- i 节点表:每个文件或目录在这里都对应有唯一一条记录。
- 数据块:存放数据
i 节点所维护的信息如下:
- 文件类型
- 文件属主
- 文件属组
- 3类用户的访问权限
- 3个时间戳
- 指向文件的硬链接数量
- 文件大小
- 实际分配给文件的块数量,以512字节块为单位
- 指向文件数据块的指针
然后来看看指向数据块的指针结构:
ext2中每个文件包含15个指针。
为什么这种设计:
- 维持 i 节点结构大小固定
- 支持任意大小的文件
- 文件系统可以以不连续方式来存储文件块
- 对小文件而言,支持快速访问
- 文件可以有黑洞,文件系统将i节点和间接指针块标记0,无需为其分配空字节的数据块
虚拟文件系统(VFS)
先来看一张图(终于不是黑白灰博客了)
恩,图中已经很明显了,所谓虚拟文件系统,就是对不同类型文件兼容然后整成一套通用接口来方便用户的使用。
这套框架包括:
1、 为用户提供统一的文件和目录的操作接口,如 open, read, write
2、 抽象出文件系统共有的一些结构,包括“目录节点”inode、“超级块”super_block 等。
3、 面向具体的文件系统,定义一系列统一的操作“接口”, 如 file_operations, inode_operations, dentry_operation,具体的文件系统必须提供它们的实现。
4、 提供一套机制,让具体的文件系统融入 VFS 框架中,包括文件系统的“注册”和“安装”
5、 实现这套框架逻辑的核心代码
用户层通过系统调用和内核交互,假设用户层的命令就是从FAT文件系统cp文件到ext4文件系统,虚拟文件系统实际干了这样一个事,它提供了统一的数据结构,向上屏蔽,向下兼容。
- 统一的数据结构:超级块用来描述文件系统的信息;inode,每一个文件都是一个inode,inode数据结构描述文件;目录项,比如我们查找/home/file的过程,/,home/,file都是目录项,通过它们才能索引到最终的文件。
- 向下兼容:虽然linux内核支持多达40多种文件系统,但是无论是什么文件系统,都必须支持VFS提供的统一的数据结构,VFS不会关心具体文件系统得到统一的数据结构之后的处理过程,但是任意一个文件系统要想被Linux操作系统支持,那么必须提供VFS要求的统一的数据结构。
- 向上屏蔽:上一层实际上还到不了用户层,我们的向上屏蔽是对于系统调用而言的,比如read和write操作的数据结构就是我们刚才说的那几个数据结构,这些系统调用不用针对不同的文件系统去采取不同的处理方式。
这也是VFS的设计精妙之处。所以跨文件系统的cp实际上是FAT按照它的方式将数据读出来组织成VFS识别的数据结构传递给VFS,然后VFS再将数据结构写入ext4,ext4再按照自己对数据的组织方式将数据保存。正是因为有VFS这一层,Linux才真正实现了支持多种文件系统。
虚拟文件系统的几个数据结构
就这样。。。
于是。。。。。