一、文件和文件系统
文件管理:把所管理的程序和数据组织成一系列的文件,并能进行合理的存储、使用等操作。
- 基本概念
(1)数据项:基本数据项和组合数据项
(2)记录:一组相关数据项集合,描述对象某方面的属性
(3)关键字:用于唯一的标识一个记录
(4)文件:有结构和无结构 - 文件类型
①按用途:系统、用户、库文件
②按数据形式:源文件、目标文件、可执行文件
③按存取控制属性:只执行、只读、读写
④按组织和处理方式:普通文件、目录文件、特殊(设备)文件 - 文件系统层次结构
(1)对象及其属性(文件、目录、磁盘空间)
(2)操纵、管理对象的软件集合(文件管理内核程序)
①文件目录的管理
②文件共享和保护等
③文件存储空间的管理
④文件逻辑地址转换
⑤文件读写管理
====》一般把与文件系统有关的软件分为四个层次:
④逻辑文件系统
③基本I/O管理程序
②基本文件系统层
①I/O控制层
- 文件操作
(1)最基本的操作
①创建/删除文件:分空间,形成FCB及目录(名,地址)
②读、写:按名检索目录,找到文件地址,开始读、写
③设置文件读写位置,实现随机存取(尤其适用于记录文件)
(2)“打开”与“关闭”:
文件读/写操作 = 检索 + 读/写
每次读写前都要重复检索增大开销。所以为了方便对同一文件的多次读写,一次检索到文件后就在内存中记录其位置,避免重复检索。被记录下位置的文件就是“打开”文件;
不需要再操作文件时,通过“关闭”这个系统调用关闭文件——即从打开文件表上删除其路径信息即可。
(3)其他操作:改名、改所属用户、改访问权限等属性的操作。
二、文件的逻辑结构
文件系统设计的关键要素:
如何构成一个文件,以及如何存储在外存。
文件结构:
文件的逻辑结构:按用户观点如何组织数据;又称文件组织
基本要求:检索速度高、方便修改、降低存储空间费用(不连续)
文件的物理结构:根据外存上的物理块的分配机制,记录文件外存的存储结构。用户感知不到
文件逻辑结构的类型:
-
按文件是否有结构分类
①有结构文件(记录式)
a.定长记录
b.变长记录
②无结构文件(字符流式)
字节为单位,利用读写指针依次访问。
系统对该类文件不需格式处理 -
按文件的组织方式分类:
(1)顺序文件
系统需按该类型记录“长度”,通常定长。
①两种记录排列方式
a.串结构:按记录形成的时间顺序串行排序。记录顺序与关键字无关;
b.顺序结构:按关键字排序
②检索方法:
a.从头检索,顺序查找要找的记录,定长的计算相对快。
b.顺序结构,可用折半查找、插值查找、跳步查找等算法提高效率
③顺序文件的优缺点:
a.不方便随机存取某条记录,但适用批量存取的场合。
b.适合磁带等特殊介质。
c.单记录的查找、修改等交互性差;增减不方便(改进办法:把增删改的记录登记在一个事务文件中,在某段时间间隔后再与原文件合并更新)。(2)索引文件:系统需为文件建立索引表
为了方便单个记录的随机存取,为文件建立一个索引表,记录每项记录在文件的逻辑地址及记录长度;该索引表按关键字排序。
①索引表内容:
索引号、长度、记录地址指针
②检索效率
索引表本身即是个按记录键排序的定长顺序文件,所以能利用算法提高索引表检索速度
③一个索引文件可以有多个索引表
为方便用户根据不同记录属性检索记录,为顺序文件建立多个索引表,每种能成为检索条件的域都配备一张索引表。
④索引文件的优缺点
适用于变长记录,可提高检索速度,实现直接存取
索引表增加了存储开销(3)索引顺序文件:建索引表,记录每组记录的第一个记录位置
a.既要方便,又要降低开销
b.将顺序文件的所有记录分组,并为每个分组建立索引表,但每个表项记录的是每组第1条记录的键值和地址。
组内记录仍按顺序方式检索和使用。
c.检索一条记录的过程:
先计算记录是在第几组,然后再检索索引确定组在哪里后,在组内顺序查找。
d.可利用多级索引,进一步提高检索效率(4)直接文件和哈希文件
给定键值(如学号)不需顺序检索直接得到记录的物理地址
哈希函数映射