Linux文件系统

南林yan

于 2024-10-08 14:36:48 发布

阅读量373

点赞数 16

分类专栏： Linux学习文章标签： linux

本文链接：https://blog.csdn.net/2301_76197086/article/details/142743697

版权

Linux学习专栏收录该内容

31 篇文章 0 订阅

订阅专栏

一、认识磁盘

二、操作系统对磁盘进行逻辑抽象

1.扇区数组sector disk_array[N]

2.逻辑区块数组LBA blocks[N]

一、认识磁盘

一个磁盘由多个盘片组成，每个盘片有两个盘面和一个磁头，每个盘面上有磁道和扇区

每个扇区存储的数据量相同，但是越靠近圆心的扇区越小，越远离圆心的扇区越大，因此不同磁道上的扇区数据密度不同

寻找指定数据只需要找到存储数据的扇区即可，确定扇区位置需要使用CHS定址法：

确定盘面Header
确定磁道Cylinder
确定扇区Sector

二、操作系统对磁盘进行逻辑抽象

1.扇区数组sector disk_array[N]

将磁道展开，抽象为由扇区组成的数组sector disk_array[N]

假设一个磁盘800GB，由两个盘片组成，则共有四个盘面，每个盘面200GB，将盘面上的磁道展开即可抽象为数组

操作系统通过数组下标即可确定查询数据被存储在哪个扇区中：例如一个盘面上有10个磁道，每个磁道上有100个扇区，则一共有4*10*100=4000个扇区，数组下标即为[0, 3999]。

假设已知数据被存放在下标为2345的扇区中，2345/1000=2确定数据在第二个盘面上，2345%1000=345确定数据在第二个盘面的第345个扇区，345/100=3确定数据在第三磁道上，345%100=45确定数据在第三磁道的第45个扇区

由此实现操作系统对磁盘的逻辑抽象，可以根据下标找到实际磁盘中数据的具体存储位置

2.逻辑区块数组LBA blocks[N]

但是一个扇区往往很小，通常为512B，读取一个数据需要找到多个扇区，效率低。所以操作系统又引入了块，规定：1个块=8个连续的扇区，即4KB。

所以操作系统读取数据时就以块为单位，即LBA（逻辑区块地址），因此又有了LBA blocks[N]数组，只需要知道LBA blocks[N]数组的下标，再乘8即可得到扇区数组的下标，进而再通过CHS定址法确定数据在磁盘中的具体位置

3.磁盘分区

对于一个800GB的磁盘，通过块作为读取数据的基本单位还是太小了，因此操作系统又可以将磁盘进行分区，类似于C盘、D盘、E盘等，但实际电脑中只有一个磁盘。

三、文件系统

1.文件系统结构

磁盘分区后每个分区仍然很大不易管理，所以操作系统会在分区中再进行分组：块组

例如一个分区100GB，分为10个块组，每个块组10GB，只需要管理好一个块组，则其他块组使用同样的管理模式也能管理好

块组中存储着文件的内容和属性数据

Data blocks（数据区）：所占空间最大，存储着文件的内容。其中分为许多LBA数据块，每个数据块都有编号

Block Bitmap（块位图）：记录Data blocks数据区中哪个数据块被占用，哪个数据块没有被占用

inode Table（i节点表）：存储文件属性，每个文件的属性都是一个大小固定的结构体。例如文件属性集合体的大小为128B，一个数据块为4KB，4*1024/128=32，i节点表中可以存放32个集合体。该结构体中包含文件大小、权限等，不包含文件名，因为包含了inode_number，在操作系统中使用inode号来唯一标识文件。除此以外还包含了datablocks[N]，用于记录文件占用的数据块编号

inode Bitmap（inode位图）：记录i节点表中哪个inode被使用，哪个inode没有被使用

GDT（块组描述符）：描述块组的属性信息，包含块组的大小，i节点表中的inode个数，数据区中的数据块的个数，已使用/未使用的inode个数等

Super Block（超级块）：描述当前块组所在分区的属性信息，包含分区的大小，分区中块组的个数，每个块组的使用情况等。超级块并不是每个块组中都有，而是部分块组拥有，这样既可以防止磁盘中存放超级块的位置被损坏从而丢失整个分区的信息，又可以节省空间资源

细节补充：

inode号和Data blocks中的数据块号在每个分区中是唯一的，i节点表中会记录当前块组中inode号和数据块号的范围。例如一个分区的每个块组中有1000个inode号，一个文件的inode号为1010，1010/1000=1，确定该文件的inode号存储在第1个块组中（前面有0号块组），1010-1001=9，inode号减去当前块组的起始inode号就可以确定在i节点表的第几个位置。又因为数据块号是以分区为单位唯一标识的，所以文件数据的存储可能存放在不同的块组中。但是不建议这样存储，因为存储数据块的不连续会导致磁盘振头和盘面的高速运转，降低效率。

Linux中ext2文件系统的i节点表中的datablocks[N]大小为datablocks[15]，说明文件数据只存储在15个数据块中，但是一个数据块仅有4KB，显然这样的存储方式存储能力太小。其实datablocks数组中的前12个位置是物理映射，直接存储对应的数据块编号，而后三个位置是虚拟映射，其存储的数据块中，存储的又是一个datablocks数组，数组中又可以存储数据块编号，该数据块又可以存储datablocks数组，以此类推，这样的存储方式就可以大大提高文件存储空间能力。