硬盘中的数据组织方式

深入了解硬盘的内部结构:

1 http://www.sansky.net/article/2007-05-31-disk-structure.html

 2 http://ncwcl.blog.51cto.com/36545/200395

 

硬盘存储结构

人们采用与软盘类似的结构生产硬盘. 也就是硬盘盘片的每一条磁道都具有相同的扇区数. 由此人们定义硬盘参数为(CHS)参数,即磁头数(Heads),柱面数(Cylinders),扇区数(Sectors),以及相应的寻址方式。

其中:

磁头数表示硬盘总共有几个磁头,也就是有几面盘片,最大为255 (用8个二进制位存储);

柱面数表示硬盘每一面盘片上有几条磁道, 最大为1023(用10个二进制位存储);

扇区数(Sectors) 表示每一条磁道上有几个扇区, 最大为63 (用6个二进制位存储);

每个扇区一般是 512个字节, 理论上讲这不是必须的, 但好象没有取别的值的;

所以磁盘最大容量为:255 * 1023 * 63 * 512 / 1048576 = 8024 GB ( 1M = 1048576 Bytes )

或硬盘厂商常用的单位:255 * 1023 * 63 * 512 / 1000000 = 8414 GB ( 1M = 1000000 Bytes )

在 CHS 寻址方式中, 磁头, 柱面, 扇区的取值范围分别为 0 到 Heads – 1,0 到 Cylinders - 1,1 到 Sectors (注意是从 1 开始)

硬盘的容量=柱面数(CYLINDER)*磁头数(HEAD)*扇区数(SECTOR)*512B.这下你也可以计算硬盘的一些参数了.


什么是簇?

         文件系统是操作系统与驱动器之间的接口,当操作系统请求从硬盘里读取一个文件时,会请求相应的文件系统(FAT 16/32/NTFS)打开文件。扇区是磁盘最小的物理存储单元,但由于操作系统无法对数目众多的扇区进行寻址,所以操作系统就将相邻的扇区组合在一起,形成一个簇,然后再对簇进行管理。每个簇可以包括2、4、8、16、32或64个扇区。显然,簇是操作系统所使用的逻辑概念,而非磁盘的物理特性。

         为了更好地管理磁盘空间和更高效地从硬盘读取数据,操作系统规定一个簇中只能放置一个文件的内容,因此文件所占用的空间,只能是簇的整数倍;而如果文件实际大小小于一簇,它也要占一簇的空间。所以,一般情况下文件所占空间要略大于文件的实际大小,只有在少数情况下,即文件的实际大小恰好是簇的整数倍时,文件的实际大小才会与所占空间完全一致。 
  “簇”是DOS进行分配的最小单位。当创建一个很小的文件时,如是一个字节,则它在磁盘上并不是只占一个字节的空间,而是占有整个一簇。DOS视不同的存储介质(如软盘,硬盘),不同容量的硬盘,簇的大小也不一样。簇的大小可在称为磁盘参数块(BPB)中获取。簇的概念仅适用于数据区。
本点:(1)“簇”是DOS进行分配的最小单位。
   (2)不同的存储介质,不同容量的硬盘,不同的DOS版本,簇的大小也不一样。
   (3)簇的概念仅适用于数据区。

 

 

 

磁盘分区简介

一个完整硬盘的数据应该包括五部分:MBR,DB*,**T,DIR区和DATA区。其中只有主引导扇区是唯一的,其它的随你的分区数的增加而增加。

要点:(1)整个硬盘可分为MBR,DBR,FAT,BD和数据区。
   (2)MBR,DBR,FAT,和BD位于磁盘外道。

  • 主引导扇区

      主引导扇区位于整个硬盘的0磁道0柱面1扇区,包括硬盘主引导记录MBR(Main Boot Record)和分区表DPT(Disk Partition Table)。其中主引导记录的作用就是检查分区表是否正确以及确定哪个分区为引导分区,并在程序结束时把该分区的启动程序(也就是操作系统引导扇区)调入内存加以执行。至于分区表,很多人都知道,以80H或00H为开始标志,以55AAH为结束标志,共64字节,位于本扇区的最末端。值得一提的是,MBR是由分区程序(例如DOS 的Fdisk.exe)产生的,不同的操作系统可能这个扇区是不尽相同。如果你有这个意向也可以自己去编写一个,只要它能完成前述的任务即可,这也是为什么能实现多系统启动的原因(说句题外话:正因为这个主引导记录容易编写,所以才出现了很多的引导区病毒)。
    要点:(1)MBR位于硬盘第一个物理扇区柱面0,磁头0,扇区1处。不属于DOS扇区,
       (2)主引导记录分为硬盘的主引导程序和硬盘分区表。
  • 操作系统引导扇区

      OBR(OS Boot Record)即操作系统引导扇区,通常位于硬盘的0磁道1柱面1扇区(这是对于DOS来说的,对于那些以多重引导方式启动的系统则位于相应的主分区/扩展分区的第一个扇区),是操作系统可直接访问的第一个扇区,它也包括一个引导程序和一个被称为BPB(BIOS参数块)的本分区参数记录表。其实每个逻辑分区都有一个OBR,其参数视分区的大小、操作系统的类别而有所不同。引导程序的主要任务是判断本分区根目录前两个文件是否为操作系统的引导文件(例如MSDOS或者起源于MSDOS的Win9x/Me的IO.SYS和MSDOS.SYS)。如是,就把第一个文件读入内存,并把控制权交予该文件。BPB参数块记录着本分区的起始扇区、结束扇区、文件存储格式、硬盘介质描述符、根目录大小、FAT个数、分配单元(Allocation Unit,以前也称之为簇)的大小等重要参数。它包含逻辑格式化时使用的参数,可供DOS计算磁盘上的文件分配表,目录区和数据区的起始地址,OBR由高级格式化程序产生(例如DOS 的Format.com)。
  • BPB格式
    序号 偏移地址 意义
    1 03H-0AH OEM号
    2 0BH-0CH 每扇区字节数
    3 0DH 每簇扇区数
    4 0EH-0FH 保留扇区数
    5 10H FAT备份数
    6 11H-12H 根目录项数
    7 13H-14H 磁盘总扇区数
    8 15H 描述介质
    9 16H-17H 每FAT扇区数
    10 18H-19H 每磁道扇区数
    11 1AH-1BH 磁头数
    12 1CH-1FH 特殊隐含扇区数
    13 20H-23H 总扇区数
    14 24H-25H 物理驱动器数
    15 26H 扩展引导签证
    16 27H-2AH 卷系列号
    17 2BH-35H 卷标号
    18 36H-3DH 文件系统号
    DOS引导记录公式:
    文件分配表≡保留扇区数
    根目录≡保留扇区数+FAT的个数×每个FAT的扇区数
    数据区≡根目录逻辑扇区号+(32×根目录中目录项数+(每扇区字节数-1))DIV每扇区字节数
    绝对扇区号≡逻辑扇区号+隐含扇区数
    扇区号≡(绝对扇区号MOD每磁道扇区数)+1
    磁头号≡(绝对扇区号DIV每磁道扇区数)MOD磁头数
    磁道号≡(绝对扇区号DIV每磁道扇区数)DIV磁头数
    要点:(1)DBR(Dos的OBR)位于柱面0,磁头1,扇区1,其逻辑扇区号为0
       (2)DBR包含DOS引导程序和BPB。
       (3)BPB十分重要,由此可算出逻辑地址与物理地址。
  • 文件分配表

      FAT(File Allocation Table)即文件分配表,是DOS/Win9x系统的文件寻址系统,为了数据安全起见,FAT一般做两个,第二FAT为第一FAT的备份, FAT区紧接在OB*之后,其大小由本分区的大小及文件分配单元的大小决定。关于**T的格式历来有很多选择,Microsoft 的DOS及Windows采用我们所熟悉的FAT12、FAT16和FAT32格式,但除此以外并非没有其它格式的FAT,像Windows NT、OS/2、UNIX/Linux、Novell等都有自己的文件管理方式。文件分配表是反映硬盘上所有簇的使用情况,通过查文件分配表可以得知任一簇的使用情况。DOS在给一个文件分配空间时总先扫描FAT,找到第一个可用簇,将该空间分配给文件,并将该簇的簇号填到目录的相应段内。即形成了“簇号链”。FAT就是记录文件簇号的一张表。FAT的头两个域为保留域,对FAT12来说是3个字节,FAT来说是4个字节。其中头一个字节是用来描述介质的,其余字节为FFH 。介质格式与BPB相同。
    第一个字节的8位意义:
    7 6 5 4 3 2 1 0
    └─────-┘ │ │ │┌0非双面
    置1 │ │ └┤
    │ │ └1双面
    │ │┌0不是8扇区
    │ └┤
    │ └1是8扇区
    │┌0不是可换的
    └┤
    └1是可换的
    FAT结构含义
    FAT12 FAT16 意义
    000H 0000H 可用
    FF0H-FF6H FFF0H-FFF6H 保留
    FF7H FFF7H 坏
    FF8H-FFFH FFF8H-FFFFH 文件最后一个簇
    ×××H ××××H 文件下一个簇
    对于FAT16,簇号×2作偏移地址,从FAT中取出一字即为FAT中的域。
    逻辑扇区号=数据区起始逻辑扇区号+(簇号-2)×每簇扇区数
    簇号=(逻辑扇区号-数据区起始逻辑扇区号)DIV每簇扇区数+2
    要点:(1)FAT反映硬盘上所有簇的使用情况,它记录了文件在硬盘中具体位置(簇)。
       (2)文件第一个簇号(在目录表中)和FAT的该文件的簇号串起来形成文件的“簇号链”,恢复被破坏的文件就是根
    据这条链。
       (3)由簇号可算逻辑扇区号,反之,由逻辑扇区号也可以算出簇号,公式如上。
       (4)FAT位于DBR之后,其DOS扇区号从1开始。
  • 目录区

      DIR是Directory即根目录区的简写,DI*紧接在第二**T表之后,只有FAT还不能定位文件在磁盘中的位置,FAT还必须和DIR配合才能准确定位文件的位置。DIR记录着每个文件(目录)的起始单元(这是最重要的)、文件的属性等。定位文件位置时,操作系统根据DI*中的起始单元,结合**T表就可以知道文件在磁盘的具体位置及大小了。在DIR区之后,才是真正意义上的数据存储区,即DATA区。DOS为目录项分配32字节。目录项分为三类:文件,子目录(其内容是许多目录项),卷标(只能在根目录,只有一个。目录项中有文件(或子目录,或卷标)的名字,扩展名,属性,生成或最后修改日期,时间,开始簇号,及文件大小。
    目录项的格式
    字节偏移 意义 占字节数
    00H 文件名 8B
    08H 扩展名 3B
    0BH 文件属性 1B
    0CH 保留 10B
    16H 时间 2B
    18H 日期 2B
    1AH 开始簇号 2B
    1CH 文件长度 4B
    目录项文件名区域中第一个字节还有特殊的意义:00H代表未使用
    05H代表实际名为E5H
    EBH代表此文件已被删除
    目录项属性区域的这个字节各个位的意义如下: 7 6 5 4 3 2 1 0
                          未 修 修 子 卷 系 隐 只
                          用 改 改 目 标 统 藏 读
                            标 标 录   属 属 属
                            志 志     性 性 性
    注意:WINDOWS的长文件名使用了上表中所说的“保留”这片区域。
    要点:(1)文件目录是记录所有文件,子目录名,扩展名属性,建立或删除最后修改日期。文件开始簇号及文件长度的一张
          登记表.
       (2)DOS中DIR列出的内容训是根据文件目录表得到的。
       (3)文件起始簇号填在文件目录中,其余簇都填在FAT中上一簇的位置上。
  • 数据区

      DATA虽然占据了硬盘的绝大部分空间,但没有了前面的各部分,它对于我们来说,也只能是一些枯燥的二进制代码,没有任何意义。在这里有一点要说明的是,我们通常所说的格式化程序(指高级格式化,例如DOS下的Format程序),并没有把DATA区的数据清除,只是重写了FAT表而已,至于分区硬盘,也只是修改了MBR和OBR,绝大部分的DATA区的数据并没有被改变,这也是许多硬盘数据能够得以修复的原因。但即便如此,如MBR/OB*/**T/DIR之一被破坏的话,也足够咱们那些所谓的DIY老鸟们忙乎半天了……需要提醒大家的是,如果你经常整理磁盘,那么你的数据区的数据可能是连续的,这样即使MB*/**T/DIR全部坏了,我们也可以使用磁盘编辑软件(比如DOS下的DiskEdit),只要找到一个文件的起始保存位置,那么这个文件就有可能被恢复(当然了,这需要一个前提,那就是你没有覆盖这个文件……)。

硬盘分区方式
          我们平时说到的分区概念,不外乎三种:主分区、扩展分区和逻辑分区。

  主分区

主分区是一个比较单纯的分区,通常位于硬盘的最前面一块区域中,构成逻辑C磁盘。在主分区中,不允许再建立其它逻辑磁盘。

  扩展分区

扩展分区的概念则比较复杂,也是造成分区和逻辑磁盘混淆的主要原因。由于硬盘仅仅为分区表保留了64个字节的存储空间,而每个分区的参数占据16个字节,故主引导扇区中总计可以存储4个分区的数据。操作系统只允许存储4个分区的数据,如果说逻辑磁盘就是分区,则系统最多只允许4个逻辑磁盘。对于具体的应用,4个逻辑磁盘往往不能满足实际需求。为了建立更多的逻辑磁盘供操作系统使用,系统引入了扩展分区的概念。

      所谓扩展分区,严格地讲它不是一个实际意义的分区,它仅仅是一个指向下一个分区的指针,这种指针结构将形成一个单向链表。这样在主引导扇区中除了主分区外,仅需要存储一个被称为扩展分区的分区数据,通过这个扩展分区的数据可以找到下一个分区(实际上也就是下一个逻辑磁盘)的起始位置,以此起始位置类推可以找到所有的分区。无论系统中建立多少个逻辑磁盘,在主引导扇区中通过一个扩展分区的参数就可以逐个找到每一个逻辑磁盘。

  需要特别注意的是,由于主分区之后的各个分区是通过一种单向链表的结构来实现链接的,因此,若单向链表发生问题,将导致逻辑磁盘的丢失。

  文件的读取

       操作系统从目录区中读取文件信息(包括文件名、后缀名、文件大小、修改日期和文件在数据区保存的第一个簇的簇号),我们这里假设第一个簇号是0023。

  操作系统从0023簇读取相应的数据,然后再找到FAT的0023单元,如果内容是文件结束标志(FF),则表示文件结束,否则内容保存数据的下一个簇的簇号,这样重复下去直到遇到文件结束标志。

     文件的写入

  当我们要保存文件时,操作系统首先在DIR区中找到空区写入文件名、大小和创建时间等相应信息,然后在Data区找到闲置空间将文件保存,并将Data区的第一个簇写入DIR区,其余的动作和上边的读取动作差不多。

     文件的删除

  看了前面的文件的读取和写入,你可能没有往下边继续看的信心了,不过放心,Win9x的文件删除工作却是很简单的,简单到只在目录区做了一点小改动――将目录区的文件的第一个字符改成了E5就表示将改文件删除了。

 

 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值