1. 磁盘存储的工作原理
基本概念
- 扇区(sector):盘片被分成许多扇形的区域
- 磁道(track):盘片上以盘片中心为圆心,不同半径的同心圆。
- 柱面(cylinder):硬盘中,不同盘片相同半径的磁道所组成的圆柱
- 每个磁盘都有两个面,每个面都有一个磁头(head)。
磁盘的组织:
-
三个参量定义唯一位置:磁道/柱面(c)、扇区(s)、磁头位置(h)
-
逻辑块是最小的传输单位
-
一维逻辑块数组按顺序映射到磁盘的盘区
- 扇区0是最外面柱面的第一个磁道第一个扇区
- 该映射是先按磁道内扇区顺序,再按柱面内磁道顺序,再按从外到内的柱面顺序来排序的
- 绝大多数磁盘都有一些缺陷扇区,因此映射必须用磁盘上的其他空闲扇区来提到这些缺陷扇区
- 对于磁盘,每个磁道的扇区数并不是常量
- 磁道的位密度
磁盘访问时间
-
寻道时间
-
把磁臂(磁头)从当前位置移动到指定磁道上所经历的时间
-
m为磁头移动一条磁道所花费的时间,s为启动时间,n为移动磁道个数
T s = m ∗ n + s T_s = m * n + s Ts=m∗n+s
-
-
旋转延迟时间
- T r = 1 2 r T_r = \frac{1}{2r} Tr=2r1,r为旋转速度
-
传输时间
-
把数据从磁盘读出或向磁盘写入数据所经历的时间。
-
b为每次所读/写的字节数。r为旋转速度b/s,N为磁道上的字节数
T t = b r ∗ N T_t = \frac{b}{r*N} Tt=r∗Nb
-
-
总访问时间: T a = T s + T r + T t T_a = T_s + T_r + T_t Ta=Ts+Tr+Tt
磁盘调度算法
-
先来先服务算法(FCFS)
- 优点:简单公平
- 缺点:效率不高,相邻两次请求可能会造成最内到最外的柱面寻道,使磁头反复移动,增加了服务时间,对机械也不利
-
最短寻道时间优先(SSTF)
- 优点:改善了磁盘平均服务时间
- 缺点:可能产生“饥饿” 现象
-
扫描算法/电梯算法(SCAN)
- 磁头按一个方向移动,在移动过程中对遇到的访问请求进行服务,然后判断该方向上是否还有访问请求,如果有则继续扫描;否则改变移动方向,并为经过的访问请求服务,如此反复。
- 优点:克服了SSTF的缺点,既考虑了距离,又考虑了方向
- 缺点:但由于是摆动式的扫描方法,两侧磁道被访问的频率仍低于中间磁道
-
循环扫描算法(C-SCAN)
-
磁头单向移动来提供服务,返回时不为任何的等待访问者服务
-
SCAN算法偏向于处理那些接近最里或最外的磁道的访问请求,所以使用改进型的C-SCAN算法可避免这个问题
-
-
LOOK算法/CLOOK
- 前进方向没有请求即回头,而不是到头再回头
其他改进算法
-
“磁臂黏着”现象:有一个或几个进程对某一磁道有较高的访问频率, 即这个(些)进程反复请求对某一磁道的I/O操作,从而垄断了整个磁盘设备
-
N-step-SCAN:
-
将请求队列分成分成长度为N的子队列,队列之间采用FCFS,队列内部采用SCAN
-
N很大~SCAN;N=1~FCFS
-
-
2-Step-SCAN,请求队列分为两个子队列(当前请求和新请求)
FLASH DISK
2 保证磁盘的可靠性
RAID——廉价冗余磁盘序列
利用冗余技术提高可靠性、利用并行提高性能
优点:
- 成本低,功耗小,传输效率高
- 可提供容错功能,有更高的安全性
数据分段并行交叉存取
- 数据分段:把一个文件的数据分成多个条带写到多个硬盘,每个条带的大小可以按需调整。
RAID分级
- 有六个级别分别是0、1、2、3、4、5、6,还有0+1
RAID0
-
提供了并行交叉存取。它虽然有效提高了磁盘I/O速度,但并无冗余校验功能。
RAID1
镜像磁盘冗余阵列,将每一数据块重复存入镜像磁盘,以改善磁盘机的可靠性。镜像盘也称拷贝盘,使有效容量下降了一半,成本较高。
RAID10和RAID01
综合RAID0和RAID1的特点
RAID 0+1:先分块再镜像
RAID 1+0:先镜像再分块
- n块盘中1块盘故障
- 都不会引起数据丢失
- 2块盘故障引起数据丢失
- RAID 0+1:n/(2n-2)
- RAID 1+0:1/(n-1)
RAID2
- 采用海明码纠错的磁盘阵列,将数据位交叉写入几个磁盘中。按位条带化
- 特点
- 并行存取,各个驱动器同步工作。
- 使用海明编码来进行错误检测和纠正,数据传输率高。
- 需要多个磁盘来存放海明校验码信息,冗 余磁盘数量与数据磁盘数量的对数成正比。
- 是一种在多磁盘易出错环境中的有效选择,并未被广泛应用,目前还没有商业化产品。
校验码、XOR数据恢复原理【PPT 5 Page 50】
RAID3
- 采用奇偶校验冗余的磁盘阵列,也采用数据位交叉,阵列中只有一个校验盘
特点:
-
将磁盘分组,采用字节级别的条带,读写要访问组中所有盘,每组中有一个盘作为校验盘。
-
校验盘一般采用奇偶校验。
-
简单理解:先将分布在各个数据盘上的一组数据加起来,将和存放在冗余盘上。一旦某一个盘出错,只要将冗余盘上的和减去所有正确盘上的数据,得到的差就是出错的盘上的数据。 【怎么知道那个盘出错?】
-
缺点:
-
恢复时间较长
-
读写性能的水桶效应瓶颈
-
RAID4
- b并行处理磁盘阵列:一种独立传送磁盘阵列,采用数据块交叉,用一个校验盘。将数据按块交叉存储在多个磁盘上
-
特点:
-
冗余代价与RAID3相同
-
访问数据的方法与RAID3不同
-
在RAID3中,一次磁盘访问将对磁盘阵列中的所有磁盘进行(同步)操作。
-
RAID4出现的原因:希望使用较少的磁盘参与操作,以使磁盘阵列可以并行进行多个数据的磁盘操作。
-
随机读快,随机写慢(竞争同一个校验盘)
-
RAID5
小结
条带化:一个字节块可能存放在多个数据盘上
- 优点:并行存取、性能好,磁盘负载均衡
- 缺点:可靠性、不同IO请求需要排队
镜像:数据完全拷贝一份
- 优点:可靠性
- 缺点:存储开销
校验:数据通过某种运算(异或)得出,用以检验该组数字的正确性
- 优点:可靠性、快速恢复
- 缺点:开销
提高I/O速度的主要途径
- 选择性能好的磁盘
- 并行化
- 采用适当的调度算法
- 设置磁盘高速缓冲区