2024年运维最新【Linux杂货铺】文件系统

硬盘读写的基本单位就是:扇区(512 B 或者 4 KB)。

通过上图得出结论: 1片 = n个磁道(柱面) ; n个磁道(柱面)= m个扇区

📂 CHS定址法

了解了磁盘上有盘片,柱面和扇区后,扇区就是磁盘读写的基本单位,想要找到数据,就要找到指定盘片上指定柱面上的指定扇区,这就是CHS定址法。

1. 找到指定的磁头(Header)

2. 找到指定的磁道/柱面(Cylinder)

3. 找到指定的扇区(Sector)

所以得出结论,盘片为什么要告诉旋转?定位指定扇区。磁头为什么要左右摆动?定位指定的磁道

📂 操作系统对硬盘的管理和抽象

如果OS直接使用CHS,耦合度太高(硬件改变,影响软件,软件也要改变),同时也为了方便实现内核进行磁盘管理,所以需要进行逻辑抽象。OS和磁盘进行交互的时候,基本单位是4KB(8个连续的Sector)

我们将一个个圆的磁盘抽象成一个巨大的数组,每一个元素就是一个sector,我们就会有一个扇区数组 sector disk_array[N]。

有了数组,天然的就会有下标index,我们就可以使用下标,通过某种算法,转换为CHS地址,这样就进行了解耦。

举个例子,我们有个硬盘,每个面有1000个扇区,10个磁道,即每1个磁道有100个扇区。

index / 1000 = H

index % 1000 = temp [0 , 999]

temp / 100 = C

temp % 100 = S

我们先确定在哪个盘面,在确定在哪个柱面,最终定位到在哪个扇区。

OS每次操作只能是512B的话,效率太低。所以一般而言,磁盘访问的基本单位是512B,OS与磁盘交互的基本单位是4KB(8 * sector)。一次I/O读取更多数据,提高了效率。

**8个连续的扇区,就称作数据块。**每一个块都有一个块号,我们通过 块号 * 8 = index ,就能将块号转为sector数组下标,得到扇区的下标就能转为CHS地址。

所以对OS而言,读取数据,就以块为单位。

所以我们只要知道了硬盘大小,就能知道有多少个块,每个块的块号也就有了,知道了起始块的块号,连续的读8个sector下标,就能转换为对应的多个CHS地址。

这就是LBA(逻辑区块地址)。LBA可以意指某个数据区块的地址或是某个地址所指向的数据区块。

这样就得到了LBA数组,LBA block[N],通过对数组的管理,达到对硬盘的管理,就是先描述,再组织。

📁 文件系统

接下来,我们使用的是Linux中的ext2文件系统进行讲解。

📂 分区

概念:分区是将硬盘空间划分成独立的区域,每个区域可以被单独管理和使用。

📂 分组

我们只要管理好一个分区,就能使用相同标准管理好所有分区,进而管理好整个硬盘。

分完区后,还是太大,所以进行分组,管理好一个组,就能管理好每个组,进而管理好一个分区。这就是分支思想。

上图是磁盘文件系统。磁盘是典型的块设备**,磁盘分区被划分为一个个block,一个block的大小是有格式化确定的,并不可以修改。**

这就引入了文件系统的概念,通过文件系统管理好分组,进而管理好分区,从而管理好硬盘,每个分区有自己的文件系统,每个分区的文件系统可以不同。

此外,我们还需要知道,Linux中,文件的内容和属性分开存储

Data blocks (数据区):存放文件内容。也是占据区域最大的。

Block Bitmap(块位图):记录者Data Block 中哪个数据块已经被占用,哪个数据块没有被占用。比特位的位置,表示块号,比特位的内容,表示该块是否被占用。

inode table (inode节点表):Linux中文件属性是一个大小固定的集合体,大小是128字节,inode内部不包含文件名,并且1个文件对应1个inode。所以在内核里,不看文件名,只看inode号。

Linux中,文件属性是一个大小固定的集合体(128 B)。其中最重要的字段是inode_num,即inode号,此外data[N]数组里面元素存储着存放内容的块的块号(N一般是15),分为一级,二级,三级等直接和间接映射

ls -li //查看文件的,并且能查看到inode

**inode bitmap:**比特位的位置表示第几个inode,内容表示该inode是否空闲可用。

**GDT(块组描述符):**块描述符,描述块组的信息。

**超级块(Super Block):**存放文件系统本身的结构信息。记录的信息主要有:bolck 和 inode的总量, 未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的 时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,**可以说整个 文件系统结构就被破坏了。**super block 存放在多个block中(2~3个),但不是每个block中都有。

以上我们就对文件系统有了基本的概念,所以我么将硬盘分区后,分组并且写入文件系统,这就是格式化。所以格式化的本质,就是在硬盘中写入文件系统。

📂 inode号

分配

inode编号的分配是以分区为单位进行分配。所以超级块 和 GDT 记录着每个分组的其实inode,结束inode,以此将inode分配个不同区域(分组)。inode bitmap 和 inode table是从0开始的,所以知道inode ,在 - 起始inode,就能对应到inode bitmap和i节点表中对应的下标,找到对应的文件属性,进而找到文件内容。

所以不同分区可能有相同的inode,但1个分区内不能有相同的inode。

Dateblock也是同样的原理,数据块也是整体分配,也有statr块号,end块号,有对应的块号也能映射到对应组的块号里面。

inode映射到对应的组后,优先使用当前组的数据块,除非文件非常大,否则不建议跨组访问。但 inode 和 数据块 是可以跨组访问的。

总结,在分区内知道了inode,就能确定在哪个分组,在组内减起始inode,就能找到inode bitmap,检测是否被用,再在i节点表中找到或存储inode属性,进而在数据块中找到对应的文件内容。

📂 逆向路径解析

前文中,我们讲解在内核中,操作一个文件,使用的是文件的inode,但用户使用的是文件名,所以文件名一定和inode存在映射关系。映射关系存储在哪呢?

目录,也是一个文件,文件内容就是 文件名 和 inode的映射关系。所以有了目录,就有了文件名和inode的映射关系。

但目录也是一个文件呀,所以目录也会查找自己的目录,找到自己的inode号,一直找到根目录为止,这就是所谓的逆向路径解析。

目录的r权限:是否允许度目录内容,即文件名:inode的映射关系,拿不到inode,就读不了。

目录的w权限:先当前目录写文件名:inode的映射关系

逆向路径解析是OS自己做的,根据文件路径,找到文件inode,这也就是为什么要有路径的原因了,也是为什么一个目录下不能建立同名文件。

但是逆向路径解析不是每一次都进行的,Linux会缓存常用的路径结构。

最后的话

最近很多小伙伴找我要Linux学习资料,于是我翻箱倒柜,整理了一些优质资源,涵盖视频、电子书、PPT等共享给大家!

资料预览

给大家整理的视频资料:

给大家整理的电子书资料:

如果本文对你有帮助,欢迎点赞、收藏、转发给朋友,让我有持续创作的动力!

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 16
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值