操作系统——第四章《文件管理》

第四章文件管理

4.1文件系统基础

4.1.1初识文件管理
1,文件的定义

文件——就是一组有意义的信息/数据集合

2,文件的属性
  • 文件名:

由创建文件的用户决定文件名,主要是为了方便用户找到文件,同一目录下不允许有重名文件。

  • 标识符:

一个系统内的各文件标识符唯一,对用户来说毫无可读性,因此标识符只是操作系统用于区分各个文件的一种内部名称。

  • 类型:

指明文件的类型

  • 位置:

文件存放的路径(让用户使用)、在外存中的地址(操作系统使用,对用户不可见)

  • 大小:

指明文件大小

  • 创建时间、上次修改时间

  • 文件所有者信息

  • 保护信息:

对文件进行保护的访问控制信息

3,文件内部应该如何被组织起来(文件的逻辑结构)
1,无结构文件

无结构文件(如文本文件)——由一些二进制或字符流组成,又称“流式文件”

2,有结构文件

有结构文件(如数据库表)——由一组相似的记录组成,又称“记录式文件”

4,文件之间应该如何被组织起来(目录结构)
5,操作系统应向上提供哪些功能

创建文件(create系统调用)

删除文件(delete系统调用)

读文件((read系统调用)

写文件(write系统调用)

打开文件(open系统调用)

关闭文件(close系统调用)

6,文件应如何存放在外存中(文件的物理结构)

与内存一样,外存也是由一个个存储单元组成的,每个存储单元可以存储一定量的数据(如1B)。每个存储单元对应一个物理地址。

类似于内存分为一个个“内存块”,外存会分为一个个“块/磁盘块/物理块”。每个磁盘块的大小是相等的,每块一般包含2的整数幂个地址(如本例中,一块包含2^10个地址,即1KB)。同样类似的是,文件的逻辑地址也可以分为(逻辑块号,块内地址),操作系统同样需要将逻辑地址转换为外存的物理地址(物理块号,块内地址)的形式。块内地址的位数取决于磁盘块的大小

操作系统以“块”为单位为文件分配存储空间,因此即使一个文件大小只有10B,但它依然需要占用1KB的磁盘块。外存中的数据读入内存时同样以块为单位.

7,操作系统如何管理外存中的空闲块(存储空间的管理)
8,操作系统需要提供的其他文件管理功能(文件共享,文件保护)
文件共享:

使多个用户可以共享使用一个文件

文件保护:

如何保证不同的用户对文件有不同的操作权限

4.1.2文件的逻辑结构

所谓的“逻辑结构”,就是指在用户看来,文件内部的数据应该是如何组织起来的。

而“物理结构”指的是在操作系统看来,文件的数据是如何存放在外存中的。

1,无结构文件

无结构文件:文件内部的数据就是一系列二进制流或字符流组成。又称“流式文件”。如:Windows 操作系统中的.txt 文件。

文件内部的数据其实就是一系列字符流,没有明显的结构特性。因此也不用探讨无结构文件的“逻辑结构”问题。

2,有结构文件

有结构文件:由一组相似的记录组成,又称“记录式文件”。每条记录又若干个数据项组成。如:数据库表文件。一般来说,每条记录有一个数据项可作为关键字。根据各条记录的长度(占用的存储空间)是否相等,又可分为定长记录和可变长记录两种。

根据有结构文件中的各条记录在逻辑上如何组织,可以分为三类

1,顺序文件

文件中的记录一个接一个地顺序排列(逻辑上),记录可以是定长的或可变长的。各个记录在物理上可以顺序存储或链式存储。

顺序存储——逻辑上相邻的记录物理上也相邻(类似于顺序表)

链式存储——逻辑上相邻的记录物理上不一定相邻(类似于链表)

串结构

记录之间的顺序与关键字无关

顺序结构

记录之间的顺序按关键字顺序排列

可变长记录的顺序文件无法实现随机存取,定长记录可以

定长记录、顺序结构的顺序文件可以快速检索(根据关键字快速找到记录)

最大缺点:不方便增加/删除记录

2,索引文件

建立一张索引表,每个记录对应一个表项。各记录不用保持顺序,方便增加/删除记录

索引表本身就是定长记录的顺序文件,一个索引表项就是一条定长记录,因此索引文件可支持随机存取

若索引表按关键字顺序排列,则可支持快速检索

解决了顺序文件不方便增/删记录的问题,同时让不定长记录的文件实现了随机存取。但索引表可能占用很多空间

3,索引顺序文件

将记录分组,每组对应一个索引表项

检索记录时先顺序查索引表,找到分组,再顺序查找分组

当记录过多时,可建立多级索引表

4.1.3文件目录
1,文件目录的实现

一个文件对应一个FCB(文件控制块),一个FCB就是一个目录项,多个FCB组成文件目录

对目录的操作:搜索、创建文件、删除文件、显示文件、修改文件

2,目录结构
1,单级目录结构

一个系统只有一张目录表,不允许文件重名

2,两级目录结构

早期的多用户操作系统,采用两级目录结构。分为主文件目录(MFD,Master File Directory)和用户文件目录(UFD,User Flie Directory)。

不同用户的文件可以重名,但不能对文件进行分类

主文件目录记录用户名及相应用户文件目录的存放位置

两级目录结构允许不同用户的文件重名,也可以在目录上实现实现访问限制(检查此时登录的用户名是否匹配)。但是两级目录结构依然缺乏灵活性,用户不能对自己的文件进行分类

3,多级(树形)目录结构

不同目录下的文件可以重名,可以对文件进行分类,不方便文件共享

系统根据“文件路径"找到目标文件

从根目录出发的路径是“绝对路径"(“/照片/2015-08/自拍.jpg”)(“/照片/2015-08/自拍.jpg”)

从“当前目录出发的路径是“相对路径"

4,无环图目录结构

在树形目录结构的基础上,增加一些指向同一节点的有向边,使整个目录成为一个有向无环图。

可以更方便地实现多个用户间的文件共享。

可以用不同的文件名指向同一个文件,甚至可以指向同一个目录(共享同一目录下的所有内容)。需要为每个共享结点设置一个共享计数器,用于记录此时有多少个地方在共享该结点。用户提出删除结点的请求时,只是删除该用户的FCB、并使共享计数器减1,并不会直接删除共享结点。

只有共享计数器减为0时,才删除结点。

注意:共享文件不同于复制文件。在共享文件中,由于各用户指向的是同一个文件,因此只要其中一个用户修改了文件数据,那么所有用户都可以看到文件数据的变化。

3,索引结点(FCB的改进)

除了文件名之外的所有信息都放到索引结点中,每个文件对应一个索引结点

目录项中只包含文件名、索引结点指针,因此每个目录项的长度大幅减小

由于目录项长度减小,因此每个磁盘块可以存放更多个目录项,因此检索文件时磁盘/O的次数就少了很多

4.1.4文件的物理结构(文件分配方式)

即文件数据应该怎样被存放在外存中

类似于内存分页,磁盘中的存储单元也会被分为一个个“块/磁盘块/物理块”。很多操作系统中,磁盘块的大小与内存块、页面的大小相同。

在内存管理中,进程的逻地址空同被分为一个一个页面
同样的,在外存管理中,为了方便对文件数据的管理,文件的逻辑地址空间也被分为了一个一个的文件“块”。
于是文件的逻辑地址也可以表示为(逻辑块号,块内地址)的形式。

1,连续分配
方式

连续分配方式要求每个文件在磁盘上占有一组连续的块。

目录项内容

起始块号、文件长度

优点
  • 顺序存取速度快

磁头移动时间短

  • 支持顺序访问和随机访问(直接访问)
缺点

会产生碎片,不利于文件拓展

2,链接分配

链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接和显式链接两种。未明确默认是隐式链接。

1,隐式链接

除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录项包括文件第一块的指针和最后一块的指针。
优点:很方便文件拓展,不会有碎片问题,外存利用率高。
缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间。

2,显式链接

把用于链接文件各物理块的指针显式地存放在一张表中,即文件分配表(FAT,File Allocation Table)。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存,并常驻内。文件目录项存放文件的起始块号(物理块号)。

优点:很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说,地址转换时不需要访问磁盘,因此文件的访问效率更高 。
缺点:文件分配表(FAT)的需要占用一定的存储空间。

3,索引分配

索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表,索引表中记录了文件的各个逻辑块对应的物理块。索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块。

  • 目录项

链接方案记录的是第一个索引块的块号,多层/混合索引记录的是顶级索引块的块号

  • 优点

支持随机访问,易于实现文件的拓展

  • 缺点

索引表需占用一定的存储空间。访问数据块前需要先读入索引块。若采用链接方案,查找索引块时可能需要很多次读磁盘操作。

4,索引分配的补充

若文件太大,索引表项太多,可以采取以下三种方法解决:

①链接方案:

如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放。

缺点:若文件很大,索引表很长,就需要将很多个索引块链接起来。想要找到i号索引块,必须先依次读入0~i-1号索引块,这就导致磁盘l/0次数过多,查找效率低下。

②多层索引:

建立多层索引(原理类似于多级页表)。使第一层索引块指向第二层的索引块。还可根据文件大小的要求再建立第三层、第四层索引块。

采用K层索引结构,且顶级索引表未调入内存,则访问一个数据块只需要K+1次读磁盘操作。

缺点:即使是小文件,访问一个数据块依然需要K+1次读磁盘。

③混合索引:

多种索引分配方式的结合。例如,一个文件的顶级索引表中,既包含直接地址索引(直接指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表)。

优点:对于小文件来说,访问一个数据块所需的读磁盘次数更少。

超级超级超级重要考点:

①要会根据多层索引、混合索引的结构计算出文件的最大长度(Key:各级索引表最大不能超过一个块);

②要能自己分析访问某个数据块所需要的读磁盘次数(Key:FCB中会存有指向顶级索引块的指针,因此可以根据FCB读入顶级索引块。每次读入下一级的索引块都需要一次读磁盘操作。另外,要注意题目条件—-顶级索引块是否已调入内存)

4.1.5文件的逻辑结构VS物理结构
逻辑结构

用户(文件创建者)的视角看到的样子
在用户看来,整个文件占用连续的逻辑地址空间
文件内部的信息组织完全由用户自己决定,操作系统并不关心

物理结构

由操作系统决定文件采用什么物理结构存储
操作系统负责将逻辑地址转变为(逻辑块号,块内偏移量)
的形式,并负责实现逻辑块号到物理块号的映射

4.1.6文件存存储空间管理
1,存储空间的划分与初始化
1,文件卷(逻辑卷)

存储空间的划分:将物理磁盘划分为一个个文件卷(逻辑卷、逻辑盘)如C盘,D盘

2,目录区与文件区

目录区主要存放文件目录信息(FCB)、用于磁盘存储空间管理的信息

文件区用于存放文件数据

2,空闲表法

空闲表中记录每个连续空闲区的起始盘块号、盘块数

分配时可采用首次适应、最佳适应等策略;回收时注意表项的合并问题

3,空闲链表法
1,空闲盘块链

以盘块勺单位组成一条空闲链

分配时从链头依次取出空闲块,回收时将空闲块挂到链尾

2,空闲盘区链

盘区为单位组成一条空闲链

分配时可采用首次适应、最佳适应等策略;回收时注意相邻空闲盘区合并的问题

4,位示图法

一个二进制位对应一个盘块。(字号,位号)或(行号,列号)与盘块号一一对应

重要考点:

要能够自己推出盘块号→(字号,位号)之间的相互转换公式

需要注意的题目条件:

二进制位O/1到底哪个代表空闲,哪个代表不空闲

字号、位号、盘块号到底是从0开始还是从1开始

5,成组链法

空闲表法、空闲链表法不适用于大型文件系统,因为空闲表或空闲链表可能过大。UNIX系统中采用了成组链接法对磁盘空闲块进行管理。

文件卷的目录区中专门用一个磁盘块作为“超级块”,当系统启动时需要将超级块读入内存。并且要保证内存与外存中的“超级块”数据一致。

4.1.7文件操作
1,创建文件(create系统调用)

1,在外存中找到文件所需的空间

2,在目录中创建该文件对应的目录项,目录项中包含了文件名,文件在外存的存放位置等信息。

2,删除文件(delete系统调用)

1,找到文件名对应的目录项

2,回收文件占用的磁盘块

3,从目录表中删除文件对应的目录项

3,打开文件(open系统调用)

将目录项中的信息复制到内存中的打开文件表中,并将打开文件表的索引号返回给用户

打开文件之后,对文件的操作不再需要每次都查询目录,可以根据内存中的打开文件表进行操作

每个进程有自己的打开文件表,系统中也有一张总的打开文件表

进程打开文件表中特有的属性:读写指针、访问权限(只读?读写?)

系统打开文件表中特有的属性:打开计数器(有多少个进程打开了该文件)

4,关闭文件(close系统调用)

1,将进程打开文件表中的相应表项删除

2,系统打开文件表的打开计数器减1,若打开计数器为0,则删除系统表的表项

5,读文件(read系统调用)

根据读指针、读入数据量、内存位置将文件数据从外存读入内存

6,写文件(write系统调用)

根据写指针、写出数据量、内存位置将文件数据从内存写出外存

4.1.8文件共享

操作系统为用户提供文件共享功能,可以让多个用户共享地使用同一个文件

1,硬链接(基于索引节点的共享方式)

各个用户的目录项指向同一个索引结点

索引结点中需要有链接计数count

某用户想删除文件时,只是删除该用户的目录项,且count–

只有count==0时才能真正删除文件数据和索引结点,否则会导致指针悬空

2,软链接(基于符号链接的共享方式)

在一个Link型的文件中记录共享文件的存放路径(Windows 快捷方式)

操作系统根据路径一层层查找目录,最终找到共享文件

即使软链接指向的共享文件已被删除,Link型文件依然存在,只是通过Link型文件中的路径去查找共享文件会失败(找不到对应目录项)

由于用软链接的方式访问共享文件时要查询多级目录,会有多次磁盘I/O,因此用软链接访问共享文件的速度要比硬链接更慢。

4.1.9文件保护
1,口令保护

为文件设置一个“口令”,用户想要访问文件时需要提供囗令,由系统验证囗令是否正确

实现开销小,但“口令”一般存放在FCB或索引结点中(也就是存放在系统中)因此不太安全

2,加密保护

用一个“密码"对文件加密,用户想要访问文件时,需要提供相同的“密码"才能正确的解密

安全性高,但加密/解密需要耗费一定的时间(Eg:异或加密)

3,访问控制

用一个访问控制表(ACL)记录各个用户(或各组用户)对文件的访问权限

对文件的访问类型可以分为:读/写/执行/删除等

实现灵活,可以实现复杂的文件保护功能

4.3文件系统

4.3.1文件系统的层次结构

1.用户接口:

用户需要通过操作系统提供的接口发出上述请求

2,文件目录系统:

由于用户提供的是文件的存放路径,因此需要操作系统一层一层地查找目录,找到对应的目录项

3.存取控制模块(存取控制验证层):

不同的用户对文件有不同的操作权限,因此为了保证安全,需要检查用户是否有访问权限

4.逻辑文件系统与文件信息缓冲区:

验证了用户的访问权限之后,需要把用户提供的“记录号”转变为对应的逻辑地址

5.物理文件系统:

知道了目标记录对应的逻辑地址后,还需要转换成实际的物理地址

6.设备管理程序模块:

要删除这条记录,必定要对磁盘设备发出请求

7.辅助分配模块:

删除这些记录后,会有一些盘块空闲,因此要将这些空闲盘块回收

4.3.2文件系统的全局结构(布局)
外存:

1,物理格式化,即低级格式化:划分扇区,检测坏扇区,并用备用扇区替换坏扇区

2,逻辑格式化后:磁盘分区(分卷Volume),完成各分区的文件系统初始化

注:逻辑格式化后,灰色部分就有实际数据了,白色部分还没有数据

内存

注:近期访问过的目录文件会缓存在内存中,不用每次都从磁盘读入,这样可以加快目录检索速度

分为用户区和内核区,其中:

用户区存放的是文件描述符

内核区存放的有:目录的缓存,系统打开文件表,进程打开文件表(存放在进程PCB中)

4.3.3虚拟文件系统&文件系统的挂载
1,虚拟文件系统的特点

①向上层用户进程提供统一标准的系统调用接口,屏蔽底层具体文件系统的实现差异

②VFS要求下层的文件系统必须实现某些规定的函数功能,如:open/read/write。一个新的文件系统想要在某操作系统上被使用,就必须满足该操作系统VFS的要求。

存在问题:不同的文件系统,表示文件数据结构各不相同。打开文件后,其在内存中的表示就不同,所以有了第三个特点

③每打开一个文件,VFS就在主存中新建一个vnode,用统一的数据结构表示文件,无论该文件存储在哪个文件系统。

注意:vnode只存在于主存中,而inode既会被调入主存,也会在外存中存储

打开文件后,创建vnode,并将文件信息复制到vnode中,添加函数功能指针到vnode,vnode的功能指针指向具体文件系统的函数功能。

2,文件系统挂载

即文件系统安装/装载–如何将一个文件系统挂载到操作系统中?

①在VFS中注册新挂载的文件系统。内存中的挂载表(mount table)包含每个文件系统的相关信息,包括文件系统类型、容量大小等。

②新挂载的文件系统,要向VFS提供一个函数地址列表

③将新文件系统加到挂载点(mountpoint),也就是将新文件系统挂载在某个父目录下。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值