文件系统是操作系统中管理持久数据的子系统。
文件系统的功能:
- 分配磁盘空间
- 管理文件集合
- 数据可靠和安全
文件描述符:操作系统在文件表中维护的表示文件状态信息的结构。包括:
- 文件指针
- 文件打开计数
- 文件在磁盘的位置
- 访问权限
文件对用户来说就是一个持久的保存数据的结构,对操作系统来说,他就是个数据块的集合。
当进程需要访问文件时,就去操作系统中读取相应的一整块数据块,然后进行操作。
进程访问文件的模式:
- 顺序访问
- 随机访问
- 索引访问
文件内部结构:无结构(字节序列,单词),简单结构(各种行列),复杂结构(可执行文件,PDF,word等)
文件共享和访问控制:用控制列表ACL。
把访问者分为用户/组/所有人,把可执行的操作分为读/写/可执行,对于每个文件都把对相关的信息放到ACL中,形成一个矩阵。
语义一致性:规定多进程如何访问文件。
- Unix文件系统语义:一个进程写着,别的进程就能看到
- 会话语义:必须写完才能看
- 读写锁:提供了几种锁,文件自行选择
当文件过多时,用目录的方式组织起来,这就是分层文件系统。
目录的操作:
- 搜索文件
- 创建文件
- 删除文件
- 列目录
- 重命名文件
- 遍历目录
目录的实现:线性表,或哈希表。
文件别名:硬链接(多个文件名指向同一个文件),软链接(用快捷方式)
为了避免文件目录有循环,我们通常限制了查找的目录长度。
子文件系统需要挂接到操作系统的文件系统才能使用。
文件系统的种类:
- 磁盘文件系统
- 数据库文件系统
- 网络/分布式文件系统
- 日志文件系统
虚拟文件系统:对所有文件系统提供统一的接口,方便应用程序访问。
文件系统的基本结构:
- 文件卷控制块,每个文件系统一个,描述文件系统的信息
- 文件控制块,每个文件一个,描述文件的数据块
- 目录项:描述文件都在哪
文件卷控制块->目录项->文件控制块->数据块
这些内容都在磁盘中存着,程序需要时再调到内存中。
调用之后会有缓存,以方便下次使用,缓存的方法有两种:
- 数据块缓存,即读进内存后,缓存了它
- 页缓存:虚拟页式存储反过来的实现,把外存中的页缓存到内存中。
打开文件的数据结构: - 文件描述符:描述目录,状态等
- 打开文件表:系统有系统打开文件表,进程有进程的打开文件表。前者包含后者。
文件分配:
- 顺序分配:优点:支持随机访问,缺点:有外碎片
- 链式分配:优点:没有外碎片,缺点:不支持随机访问
- 索引分配:优点:支持随机访问,也没有外碎片,缺点:对于大文件来说需要添加索引表。
实际中通常将这三种结合起来使用,小文件时用顺序,大文件时索引
空闲空间管理:
位图,链表,链式索引
冗余磁盘阵列RAID:提高磁盘读写性能和可靠性的技术。
RAID0:把数据块分为几部分,往几个磁盘里读写,读写性能成倍增加。
RAID1:把数据做镜像,往几个磁盘里写,可靠性增加。
RAID4: 在RAID0的基础上,加了校验和,提高了可靠性
RAID5:把校验和分块放在不同的磁盘上,可靠性进一步提高
这些RAID可以嵌套使用。