信息系统安全导论第三章容错技术

解包

已于 2023-03-22 11:40:51 修改

阅读量936

点赞数 1

分类专栏：学习记录文章标签：网络安全

于 2023-03-06 11:21:36 首次发布

本文链接：https://blog.csdn.net/JieBao11/article/details/129358125

版权

学习记录专栏收录该内容

17 篇文章 4 订阅

订阅专栏

文章介绍了容错计算的概念，强调了系统可靠性与可用性的区别，并提出提高可靠性的措施，如避错和容错。硬件冗余通过备份和表决系统提高可靠性，如RAID级别的不同策略。软件冗余涉及故障恢复策略和软件容错技术，如恢复块和N-版本程序设计。信息冗余利用奇偶校验和海明码进行错误检测与纠正。时间冗余通过检查点实现故障后的恢复。

摘要由CSDN通过智能技术生成

一、容错计算概述

1.可靠性

系统可靠性（Reliability）的定义是指系统在一段时间内、在一定条件下无故障地执行指定功能的能力或可能性。通常用失效率表示。

2.可用性

可用性（Availability）是指计算机的使用效率，即系统在执行任务的任意时刻能正常工作的概率。

系统可用性用可用度来度量。系统在t时刻处于正确状态的概率称为可用度，用A(t)来表示。

其计算方法为：A =平均无故障时间/ (平均无故障时间+平均修复时间)

3.可靠性VS可用性

A系统每年因故障中断十次，每次恢复平均要30分钟，B系统每年因故障中断2次，每次需6小时恢复。则A系统可用性比B系统高，但可靠性比B系统差。

可靠性的量化指标是周期内系统平均无故障运行时间，可用性的量化指标是周期内系统无故障运行的总时间。一般提高可靠性的同时，也同时提高了可用性。

4.提高可靠性的措施

避错（Fault Avoidance）。提高软硬件的质量，将出错率降至最低，理想情况是避免出错。

容错性（Fault Tolerance）。发展容错技术，使得在故障发生时，系统仍能继续运行。

5.容错性

容错主要依靠冗余设计来实现，它以增加资源的办法换取可靠性。由于资源的不同，冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。

6.容错系统工作方式

1）自动侦测(Auto-Detect)：运行中自动检测冗余系统各冗余单元是否存在故障。

2）自动切换(Auto-Switch) ：当出现故障时，自动使用冗余设备替换故障设备，接管当前任务。

3）自动恢复(Auto-Recovery)：故障主机被替换后，进行故障隔离，离线进行故障修复。修复后再接管原来的任务。

二、硬件冗余

1.增加线路、设备、部件，形成备份

硬件容错方法之一是硬件堆积冗余。在物理级可通过元件的重复来实现（如相同元件的串、并联，四倍元件等），在逻辑域可采用多数表决方案。冗余部分处于热状态。

另一硬件容错的方法叫待命储备冗余。该系统中共有M＋1个模块，其中只有一块处于工作状态，其余M块都处于待命接替状态。冗余部分处于冷状态。

混合冗余系统是堆积冗余和待命储备冗余的结合应用。当堆积冗余中有一个模块发生故障时，立刻将其切除，并代之以无故障待命模块。这种方法可达到较高的可靠性。

双机容错和双机热备

双机热备份是当CPU出现故障时由闲置状态的备份系统接替，但正在处理的交易有可能丢失，从而导致数据的不一致。

冗余部分处于冷状态。

三机表决系统

在三机表决系统中，三台主机同时运行，由表决器 (Voter)根据三台机器的运行结果进行表决，有两个以上的机器运行结果相同，则认定该结果为正确。

冗余部分处于热状态。

集群系统

均衡负载的双机或多机系统就是集群系统(Clusting)，适用于大型关键业务系统。

RAID系统

RAID (Redundant Arrays of Inexpensive Disks，廉价磁盘冗余阵列；Redundant Array of Independent Disks，独立磁盘冗余阵列），是一种把多块独立的硬盘（物理硬盘）按不同的方式组合起来形成一个硬盘组（逻辑硬盘），从而提供比单个硬盘更高的存储性能和提供数据备份技术。

RAID的优点：

通过把多个磁盘组织在一起作为一个逻辑卷提供磁盘跨越功能；
通过把数据分成多个数据块（Block）并行读写多个磁盘以提高访问磁盘的速度；
通过镜像或校验操作提供容错能力。

RAID级别：建议参考以下视频【硬件科普】磁盘阵列是什么东西？为什么需要磁盘阵列？不同阵列之间的区别是什么？_哔哩哔哩_bilibili

数据基带条阵列（RAID0）：简单将数据分配到各个磁盘上，不提供真正容错性。

优点：多个硬盘并行工作，提高了读写性能

缺点：无容错能力，任一磁盘失效，数据可能丢失，且不能恢复。

磁盘镜像（RAID1）：数据同时以同样的方式写到两个盘上，两个盘互为镜像。

优点：策略简单，提供了容错能力。

缺点：磁盘利用率只有50%。由于磁盘冗余，硬件开销较大，成本较高。

并行海明纠错阵列（RAID2）：与RAID0类似，只是加入了海明冗余纠错码，数据按位存放到不同的硬盘上，并行读写。

优点：可靠性高，可确定哪个硬盘已经失效，并进行自动数据恢复。

缺点：磁盘冗余太多，开销太大。

奇偶校验并行位交错阵列（RAID3）：与RAID2类似，将海明码换成了奇偶校验，因此只需要一个奇偶校验盘，对数据的处理以带区为单位。

优点：速度快，适合较大单位数据的读写，

缺点：奇偶校验盘没有冗余，出错后数据很难恢复。

奇偶校验扇区交错阵列（RAID4）：与RAID3类似，采用单独奇偶校验盘。但数据是以扇区(sector)交错方式存储于各台磁盘，对数据的访问以磁盘为单位。读一个扇区，只需访问一个磁盘。写一个扇区，只访问一个数据盘和一个校验盘。

优点：各磁盘可独立工作（扇区读写），并行读写。

缺点：只有一个单独的奇偶校验盘，出错后数据很难恢复。校验码在一个磁盘上，产生写性能瓶颈（不能同时写多个磁盘）。

循环奇偶校验阵列（RAID5）：与RAID4类似，但校验码不固定在一个磁盘上，而是循环地依次分布在不同的磁盘上。它是目前采用最多、最流行的方式，至少需要3个硬盘。

优点：校验码分布在多个磁盘中，使得写操作可以同时进行。为读操作提供了最优的性能。假如一个磁盘失效，分布在其他盘上的信息可以恢复数据（即数据重建）。

缺点：数据重建会降低读性能；每次计算校验信息，写操作开销会增大，是一般存储时间的3倍。

二位奇偶校验阵列（RAID6）：也称为P+Q冗余技术或RAID0+1，其含义是它结合了RAID0的性能和RAID1的可靠性。将整个磁盘阵列看成一个二维阵列。RAID5只在一组（相当于行）上有奇偶校验盘，而RAID6在各组的同一位置的盘组成的列上也加上了奇偶校验盘。这两个奇偶校验盘形成了二维阵列（逻辑上的）。