81-82-83-84-85-86 - 文件系统设计与实现

---- 整理自狄泰软件唐佐林老师课程

查看所有文章链接:(更新中)深入浅出操作系统 - 目录

文章目录

1. 问题

  • 能够读写硬盘扇区是否就可以创建文件?
  • 对硬盘而言只有扇区的概念,没有文件的概念,文件是操作系统中的概念。
  • 文件是 有逻辑关联的数据集合,并且 数据之间有存储上的先后关系
  • 那么,硬盘和文件是如何联系在一起的呢?

1.1 硬盘上最最最简单的文件系统支持方式

  • 一个扇区就是一个文件,则:
    • 文件名就是逻辑扇区号(LBA)
    • 扇区第0字节存储文件长度
    • 文件大小最多511字节

在这里插入图片描述

  • 缺陷:
    • 文件数量太多:用不上那么多文件
    • 文件名不友好:使用不方便
    • 文件容量太小:完全不够用
  • 启示
    • 文件中有一个逻辑上的“指针”,用于标识读写位置
    • 文件背后有一个“缓冲区”,方便指定位置数据读写

1.2 改进思路

  • 支持自定义文件名(仅限制文件名字符数量)
  • 使用硬盘固定位置 文件名扇区号映射
  • 将多个扇区组织在一起,共同存储属于同一文件的数据

在这里插入图片描述
如:DELPHI.TXT文件名和第35号扇区做映射

1.3 更多细节问题

  • 如何区分硬盘上的哪些扇区空闲,哪些扇区被文件使用?
  • 硬盘上的哪个位置记录文件名和扇区的映射关系?
  • 文件内容超过512字节时,如何增加扇区并维护前后关系?

1.4 文件系统概要设计

在这里插入图片描述

1.5 硬盘数据逻辑示意图

在这里插入图片描述

1.6 硬盘数据物理组织示意

在这里插入图片描述

2. 问题

  • 当目标文件需要保存的数据大于512字节时,如何获取更多的存储空间?
    • 选择一个(多个)空闲扇区分配给目标文件使用即可。
  • 如何高效的查询以及获取空闲扇区?
    • 将扇区分配表组织成不同的链表
    • 扇区分配表中的 每个链表 代表 一个文件
    • 未使用的扇区也组织成一个链表(即:空闲链表,每次从头部取扇区,O(1))
    • 文件管理的过程可看作扇区在不同链表中移动的过程

2.1 硬盘基础概念

  • 硬盘分区
    • 对硬盘进行分割,分割成不同的硬盘区域
  • 格式化
    • 格式化是指对硬盘分区进行的一种初始化操作(设置扇区分配表的初始状态,比如说:在扇区分配表中将所有的扇区标记为空闲扇区)
    • 格式化会使得硬盘分区中的所有文件被清除

2.2 课程中的解决方案

  • 将整个硬盘当作唯一分区使用
  • 对硬盘分区进行格式化
    • 建立 引导区根目录区扇区分配表
  • 根目录的本质就是一个文件
    • 目录(文件夹)本质 就是 文件

2.3 数据结构设计

在这里插入图片描述

2.4 格式化的关键

  • 计算扇区分配表的大小(map size):

在这里插入图片描述

  • 构建空闲扇区链表:
    • 将扇区分配表中的所有成员全部组织到空闲链表中

在这里插入图片描述

2.5 编程实验:文件系统的初步实现

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 81

  1. qt上结果如下:

在这里插入图片描述
在这里插入图片描述

  1. 将qt下格式化的“hd.img”放入到D.T.OS路径下,结果如下:

在这里插入图片描述
在这里插入图片描述

3. 问题

  • 如何在根目录区中创建文件?

3.1 根目录的本质

  • 根目录 在文件系统中是一个特殊的文件
  • 根目录中存储了 文件的基本信息(FileEntry
    • FileEntry包含了文件名,文件起始扇区,文件大小等信息

在这里插入图片描述

3.2 根目录逻辑结构

在这里插入图片描述

3.3 文件实现的基础:扇区管理

  • 如何 获取 / 归还 空闲扇区?
  • 如何 查找当前扇区的后续扇区
  • 如何为当前文件 增加 / 删除 一个扇区?
    ……

3.4 扇区申请

在这里插入图片描述

3.5 一些注意事项

  • 扇区操作是一种 外存操作,因此需要仔细计算目标位置
  • 扇区管理时 使用 相对扇区地址扇区读写时 使用 绝对地址
    在这里插入图片描述

●关系如下:
在这里插入图片描述

3.6 访问数据扇区对应的分配表项

  • 分配表项就是管理单元
    • 计算相对扇区地址:offset = si - mapSize - 2
      (注释:即扇区分配表中的第几个扇区)
    • 计算目标扇区:sctOff = offset / MAP_ITEM_CNT
      (注释:一个扇区包含MAP_ITEM_CNT个分配单元,这里的除法算完后即可得到目标在扇区分配表中是第几个扇区)
    • 计算目标扇区内偏移:idxOff = offset % MAP_ITEM_CNT
      (注释:得到扇区分配表中的第几个扇区之后,计算出在该扇区内的偏移,即在该扇区中偏移了几个分配单元)

在这里插入图片描述

3.7 核心数据结构及数量关系

在这里插入图片描述

3.8 需要实现的部分扇区管理函数

在这里插入图片描述

3.9 编程实验:扇区管理函数的实现

  1. 获取 / 归还空闲扇区

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 82 / 00获取归还空闲扇区

在这里插入图片描述
在这里插入图片描述

  1. NextSector测试

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 82 / 01testNextSector

在这里插入图片描述
在这里插入图片描述

  1. 所有扇区管理函数

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 82 / 02

4. 问题

  • 如何在根目录区中 创建文件
  • 申请扇区,写入文件信息数据(FileEntry)
  • 扇区申请成功后,还需要做哪些工作?

4.1 根目录本质回顾

根目录(文件) 中存储的是FileEntry类型 的值,每个FileEntry值表示一个硬盘上的文件。

在这里插入图片描述

4.2 根目录中创建文件的流程

在这里插入图片描述

4.2.1 在根目录中创建文件

在这里插入图片描述

4.2.2 CheckStorage() - 写入数据前的检查

在这里插入图片描述

4.2.3 在根目录中写入新文件信息

在这里插入图片描述

4.2.4 编程实验:在根目录中创建文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 83 / 00在根目录中创建文件

在这里插入图片描述

4.2.5 思考

  • 如何判断在根目录中是否存在指定文件?
  • 直接查找根目录的数据链表,如果文件存在,那么必然能够查找到对应的FileEntry。

4.3 根目录中查找文件的流程

在这里插入图片描述

4.3.1 文件查找的本质

  • 在数据链表中查找FileEntry值

在这里插入图片描述

4.3.2 FindFileEntry() - 文件查找的核心

在这里插入图片描述

4.3.3 在扇区中查找FileEntry

在这里插入图片描述

4.3.4 编程实验:在根目录中查找文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 83 / 01在根目录中查找文件

在这里插入图片描述

4.3.5 思考

  • 如何在根目录中删除文件?

4.4 在根目录中删除文件

4.4.1 实现思路

根据 文件名 在根目录的数据链表中查找FileEntry值
当查找成功时:从数据链表中删除FileEntry值

  • 关键问题:
    FileEntry值的实际位置是在硬盘上,那么如何从硬盘上抹除这个值呢?
  • 解决方案:
    1. 判断目标文件是否打开(只有关闭状态能被删除)
    2. 根据名字查找目标FileEntry的位置(如:FileEntry 2)
    3. 将数据链表中最后一个FileEntry值复制到FileEntry的位置
    4. lastBytes = lastBytes - sizeof(FileEntry)

在这里插入图片描述

4.4.2 根目录中删除文件的流程

在这里插入图片描述

4.4.3 关键细节

  • FileEntry移动时需要保留原inSctIdx和inSctOff的值
    在这里插入图片描述

  • 抹除最后一个FileEntry所占用的空间,即:修改lastBytes,使其减少64字节

  • 扩展问题:

    • 删除最后一个FileEntry之后,如果lastBytes的值为0,那么应该做什么样的操作?
    • 归还扇区的操作

4.4.4 数据链表中的字节删除

在这里插入图片描述

4.4.5 数据链表容量调整

在这里插入图片描述

4.4.6 编程实验:在根目录中删除文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 84 / 00在根目录中删除文件

在这里插入图片描述
在这里插入图片描述

4.4.7 思考

  • 如何重命名根目录中的文件?

4.5 重命名根目录中的文件

4.5.1 解决方案

  1. 判断目标文件是否已经打开(只有关闭状态能重命名)
  2. 根据名字查找目标FileEntry的位置(如:FileEntry 4)
  3. 查找新名字是否已经被占用
    • 如果没有占用,修改目标FileEntry的name成员
    • 如果已经占用,返回失败

4.5.2 根目录中重命名文件的流程

在这里插入图片描述

4.5.3 文件重命名

在这里插入图片描述

4.5.4 FileEntry写回硬盘

在这里插入图片描述

4.5.5 编程实验:在根目录中重命名文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 84 / 01在根目录中重命名文件

在这里插入图片描述
在这里插入图片描述

4.5.6 思考

  • 如何 读写 已经存在的文件?

4.6 读写已经存在的文件

4.6.1 文件读写的常规流程

在这里插入图片描述

4.6.2 需要深入思考的问题

  • 打开一个文件意味着什么?
  • 如何高效的标识已打开的文件?
  • 读写文件数据时必须操作硬盘吗?
  • 如何指定读写文件的位置?
  • ……

4.6.3 文件描述符数据结构设计

文件描述符 需要反映当前文件的状态,如:文件名,读写位置,文件长度,等。

4.6.4 文件打开与关闭函数的实现

  • FOpen:

在这里插入图片描述

  • FClose:

在这里插入图片描述

4.6.5 写文件时需要考虑的问题

  • 需要写入的数据量与文件读写指针的关系
    如:当缓冲区满时,需要如何处理?
  • 写入数据的同时,文件数据链表是否发生变化?
    如:对刚创建的文件写入数据时会发生什么?

4.6.6 文件数据写入函数

在这里插入图片描述

  • 缓冲区的准备

在这里插入图片描述

  • 缓冲区数据写入

在这里插入图片描述

4.6.7 编程实验:文件数据写入

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 85

在这里插入图片描述
在这里插入图片描述

4.6.8 思考

  • 如何从文件中读取数据?

4.7 从文件中读取数据

4.7.1 读文件时需要考虑的问题

  • 需要读取的数据量与文件读写指针的关系
    如:文件数据总量小于读取需求量,该如何处理?
  • 读取数据时,文件数据数据缓冲区如何变化?即:是否需要使用数据缓冲区?

4.7.2 文件数据读取函数

在这里插入图片描述

  • 缓冲区数据读取

在这里插入图片描述

  • 辅助函数的实现

在这里插入图片描述

4.7.3 编程实验:文件数据读取

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 86 / 00文件数据读取

在这里插入图片描述
在这里插入图片描述

4.7.4 文件系统中的辅助函数

在这里插入图片描述

4.7.5 数据擦除函数的定义与实现

在这里插入图片描述

4.7.6 文件读写指针移动函数

在这里插入图片描述

4.7.7 FSeek & FTell

在这里插入图片描述

4.7.8 编程实验:辅助函数的实现

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 86 / 01辅助函数的实现

在这里插入图片描述
在这里插入图片描述

4.7.9 扩展思考

  • 有了文件系统后,内核可以发生怎样的变化?

5. 系列完结

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

uuxiang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值