1. 文件系统概述
- 操作系统中管理文件的部分称为文件系统,负责文件的构造,命名,访问,使用,保护,实现和管理方法。
- 文件是对磁盘等存储设备进行的抽象,类似于进程是对CPU处理器的抽象,虚拟地址空间是对物理内存的抽象。
2. 文件
- 文件命名
不同的OS支持不同的命名方式,一般为文件名分为两部分,通过’.'进行分割,后半部分称为扩展名,用于表示某种类型的文件。 - 文件结构
- 字节序列:文件在OS看来都是一系列字节,真正的内容需由用户程序就是解析。
- 记录序列:每个记录之间有相应的界限,读操作返回一个记录,写操作覆盖或追加一个记录。
- 树形结构:按某个关键件进行排序形成的多叉树结构(如,B+树)。
- 文件类型
操作系统支持多种类型的文件,如普通文件与目录,Unix中还有特殊文件(对设备的抽象),如字符特殊文件,对打印机等设备的抽象;块特殊文件,对磁盘等设备的抽象。 - 文件访问
- 顺序访问
进程在这些系统中可从头按顺序读取文件的全部字节或记录,但不能跳过某一些内容,也不能不按顺序读取。 - 随机访问
能够以任何次序读取其中的字节或记录。
- 顺序访问
- 文件属性
文件属性定义了一系列属性用来标志当前文件的状态,如文件创建者,所有者,是否只读,上次被访问时间,上次被修改时间等等。
3.文件系统的实现
- 文件的系统布局
磁盘被划分为多个分区,0号分区为主引导记录(MBR,master boot record),之后跟随着分区表,记录着之后的每个分区的起始地址和结束地址
- 分区的组成:
每个分区为一个文件系统
引导块:存放着此文件系统上的操作系统
超级块:包含当前文件系统的一些属性
空闲空间管理:管理磁盘的使用情况
i节点:数据结构为数组,每个元素包含某个文件的所有的地址块
根目录:当前文件系统的根目录
目录和文件:其他目录与文件
2. 文件的实现
1. 连续分配(类比数组)
文件存储在连续的块中,每个文件都从一个新的块开始存储。查询快,主要起始地址+块的长度即可定位,问题:文件删除后有碎片空间。
2. 链表分配(类比于链表)
问题:由于指针占据一些空间,使得文件数据的大小不为2的幂,导致操作系统的性能下降
3. FAT(file allocation table)
将链表分配的中指针提取出来,放入内存中,形成一张FAT表。问题:当前磁盘空间较大时,需要大量的内存空间存放FAT。
4. i节点
记录每个文件的磁盘块地址。
4.文件系统管理
- 文件系统把文件分割成固定大小的块来存储
- 块大小的决定
- 太小,相同的文件需要更多的块,造成磁盘频繁的寻道和旋转,性能较差。
- 太大,小文件会浪费大量空间
- 随着磁盘空间的不断加大,空间利用率显得不那么重要(浪费一些空间是可以容忍的),所以磁盘块应设置的较大,以获取较小的性能。
- 记录空闲块
- 链表法
- 使用链表存储块的块号,消耗空间较多
- bitmap
- 使用bitmap存储块号,消耗空间较小
- 链表法