Recovery from Fault(故障恢复策略)

在fault tolerance中有两种方法进行故障恢复,error handling(错误处理)和fault handling(故障处理),前者消除出现的错误但不能根除故障(fault)的根源,后者旨在去除fault。 

1)Error handling

有两种方案,分别是checkpoint and repair 和masking。checkpoing and repair是让系统定期地进行状态保存,记录在checkpoint中,当检测出错误时,利用记录的checkpoint回滚(rollback)到之前正确的系统状态(system state)。masking,中文是掩蔽的意思,当一个组件出错时,用这个组件的冗余组件(redundant component)进行替换。

2)Fault handling:通过隔离(isolate)故障组件(faulty component)恢复系统并消除故障(fault)。一个常见的例子是虚拟内存系统,每个进程在不同的地址空间中运行,不能相互干扰,如一个进程中未初始化的指针不会乱指到另一个进程的地址空间,给另一个进程的执行造成错误,但是这对于内核级(kernel-level)的进程却无能为力,因为内核自己在管理虚拟内存系统,因此当内核级的进程出现错误时(假设因为辐射和低电压造成了指针乱指),会使整个系统崩溃。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值