EXT2/3文件系统的解读

        Linux最传统的磁盘文件系统用的就是EXT2,所以要了解文件系统就要从EXT2开始。文件系统是建立在硬盘上的,因此我们要了解硬盘的组成,关于硬盘的组成,我会在计算机组成与接口里面跟大家讨论。

        大家都用过U盘吧,U盘有个格式化的过程,也就是说磁盘分区完毕后,必须要格式化之后操作系统才能用这个分割槽。 为什么需要进行格式化呢?这是因为每种操作系统所设定的文件属性/权限都不相同, 为了存放这些档案所需癿数据,因此就需要将分割槽格式化,以成为操作系统能够利用的文件系统格式。

      传统的磁盘文件系统应用中,一个分割槽就只能够被格式化成为一个文件系统,所以我们可以说一个 filesystem 就是一个 partition。但是由于新技术的利用,例如我们的 LVM 和软件磁盘阵列(software raid), 这些技术可以将一个分割槽格式化为多个文件系统(例如 LVM),也能够将多个分割槽合成一个文件系统(LVM, RAID)! 所以说,目前我们在格式化时已经不再说成针对 partition 来格式化了, 通常我们可以称呼一个可被挂载的数据为一个文件系统而不是一个分割槽喔!

       那么文件系统是如何运作的呢?这就是今天的重点了。这和操作系统的档案数据有关。操作系统的档案数据除了档案实际内容外, 还有非常多的属性,例如 Linux 操作系统的档案权限(rwx)和文件属性(拥有者、群组、时间参数等)。 文件系统通常会将这两部分的数据分别存放在不同的区块:权限和属性放置到 inode 中,实际数据则放置到 data block 区块中。 另外,还有一个超级区块 (superblock) 会记彔整个文件系统的整体信息,包括 inode 不和block的总量、使用量、剩余量等。

       每个 inode  和 block 都有编号,这三个数据的意义可以简略说明如下:
                superblock:记彔此 filesystem 癿整体信息,包括 inode/block 的总量、使用量、剩余量, 以及文件系统的格式和相关信息等;
                inode:记彔档案的属性,一个档案占用一个 inode,同时记彔此档案的数据所在的 block 号码;
                block:实际记彔档案的内容,若档案太大时,会占用多个 block 。

       由于每个 inode 和 block 都有编号,而每个档案都会占用一个 inode ,inode 内则有档案数据放置的block 号码。 因此,如果能够找到档案的 inode ,自然就会知道这个档案所放置数据的 block 号码, 当然也就能够读出该档案的实际数据了。这是个比较有效率的作法,因为如此一来我们的磁盘就能够在短时间内读出全部数据, 读写效能比较好。这就是所谓的索引是文件系统(index allocation)。而FAT格式的文件系统则是根据每个block来寻找下一个block,这样搜寻的方法在档案数据很大的情况下效率很低,就需要“碎片整理了”呵呵。下面贴一张图让大家理解下”索引式文件系统“:

      inode。可以说EXT2就是基于inode的文件系统。

      inode 的内容在记彔档案的权限和相关属性,至于 block 区块则是在记彔档案的实际内容。 而文件系统一开始就将 inode 和 block 规划好了,一般是每1KB或每2KB就设置一个inode,除非重新格式化(或利用resize2fs 指令更文件系统大小),否则 inode 和 block 固定后就不在变化。但是如果我的文件系统高达数百 GB 时, 那举将所有癿 inode 和 block 通通放置在一起将是很不明智决定,因为 inode 和 block 的数量太庞大,不容易管理。因此 Ext2 文件系统在格式化时基本上是分为多个区块群组 (block group)的,每个区块群组都有独立的inode/block/superblock 系统。感觉上就好像我们在当兵时,一个营里面有分成数个连,每个连有自己的联络系统, 但最终都向营部回报连上最正确的信息一样!这样分成一群群的比较好管理啦!

     inode table (inode 表格)就是 inode 中记录内容的表格!如前所述 inode 内容在记彔档案的属性以及该档案实际数据是放置在哪几号 block 内! 基本上,inode 记彔的档案数据至少有底下这些:
                                      该档案的权限(read/write/excute);
                                      该档案的拥有者和群组(owner/group);
                                      该档案癿容量;
                                      该档案建立时状忞和时间(ctime);
                                      最近一次的读取时间(atime);
                                      最近修改的时间(mtime);
                                      档案特性的标识(flag),如 SetUID...;
                                      该档案真正内容的指针 (pointer); 

inode 的数量和大小也是在格式化时就已经固定了,每个 inode 大小均固定为 128 bytes;每个档案都仅会占用一个 inode 而已;因此文件系统能够建立的档案数量与 inode的数量有关;系统读取档案时需要先找到 inode,分析 inode 所记彔的权限与用户是否符合,若符合才能开始实际读取 block的内容。

        block。data block (资料区块)
data block 是用来放置档案内容数据地方,在 Ext2 文件系统中所支持的 block 大小有 1K, 2K 及 4K三种。在格式化时 block 的大小就固定了,每个 block 都有编号,以方便 inode 癿记彔。不过要注意的是,由于 block 大小的差异,会导致该文件系统能够支持的最大磁盘容量和最大单一档案容量不同。

        原则上,block 的大小和数量在格式化完就不能再修改了了(除非重新格式化);

        每个block只能存档一个档案的数据;

        若档案内容大于block大小,则会占用多个block。

       若档案小于一个Block的大小,则block的剩余空间就不能被利用,造成磁盘空间的浪费。

      SuperBlock: Superblock (超级区块)Superblock 是记彔整个 filesystem 相关信息的地方,没有 Superblock ,就没有这个 filesystem 了。他记彔的信息主要有:
                              block 和 inode 的总量;
                              未使用和已使用的 inode / block 数量;
                              block 和 inode 的大小 (block 为 1, 2, 4K,inode 为 128 bytes);
                              filesystem 的挂载时间、最近一次写入数据的时间、最近一次检验磁盘 (fsck)的时间等文件系统的相关信息;
                              一个 valid bit 数值,若此文件系统已被挂载,则 valid bit 为 0 ,若未被挂载,则 valid bit 为1 。
       Superblock 是非常重要的,因为我们这个文件系统基本信息都写在这里,因此,如果 superblock挂掉了,你的文件系统可能就需要花费很多多时间去挽救!一般来说superblock 的大小为1024bytes。相关 superblock 信息我可以以 dumpe2fs 观察。此外,每个 block group 都可能有 superblock 喔!但是我们也说一个文件系统应该仅有一个superblock 而已,那是怎么回事? 事实上除了第一个 block group 内会有 superblock 外,后续的 block group 不一定有 superblock , 而若有 superblock 则该 superblock 主要是做为第一个 block group 内 superblock 的备份,这样可以进行 superblock 的rescue!


      OK,再来谈一下跟inode相关的“硬链接”的问题。我们在ls时候会发现第二个字段是与inode相关的,说的是:“连接到此节点的档案个数”,只是咋回事呢?不是说每个档案占用一个inode吗?怎么多个档案跟这一个inode相关?是这样的,Unix/Linux系统允许,多个文件名指向同一个inode号码。这意味着,可以用不同的文件名访问同样的内容;对文件内容进行修改,会影响到所有文件名;但是,删除一个文件名,不影响另一个文件名的访问。这种情况就被称为"硬链接"(hard link)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值