基于windows完成端口的高性能服务器框架的研究与实现,高性能服务器故障诊断方法的研究与设计...

摘要:

高性能服务器的应用领域越来越广,目前已经广泛应用于银行、军事、航天、气象服务等领域。在这些领域中,高性能服务器都是用来处理关键的业务,系统数据丢失或者异常停机都会造成严重的后果。因此对高性能服务器的可用性提出了很高的要求。高可用性需要高效的故障检测、故障诊断、故障恢复等技术来实现。 高性能服务器一般都采用集群的形式实现,因为集群在价格、可扩展性等方面都要比其他形式的系统有明显的优势。本文主要针对高性能集群服务器系统研究一种基于操作系统的快速高效的故障诊断方法。从系统可以提供不间断服务的角度出发,研究针对故障诊断的系统监控方法,即故障监控方法。在故障监控的基础上,研究故障诊断的方法。目标是尽可能小的系统开销,尽可能大的故障检测覆盖率。 实现了服务级和节点级的诊断粒度。整个诊断从流程上分为故障监控和故障诊断,从实现的诊断粒度上分为了单机故障诊断和系统级故障诊断。能够监控到节点的硬件状态信息,如CPU、内存、网络设备、电源等;能够监控基于linux的操作系统中的各种进程的信息,包括核心系统服务进程,用户配置的进程等。从可用性角度设计了针对不同监控信息的诊断规则,实现了单机故障的快速诊断。对整个集群系统设计了心跳模块以及系统级的故障诊断。通过设计的心跳机制可以确定其他节点是否故障。通过单机故障诊断和系统级故障诊断的配合能够快速的诊断出故障的节点,达到集群中所有节点对故障状态的一致性描述。通过整个诊断系统,能够准确及时的获得诊断结果,及时的将故障节点隔离出系统,进而提高系统的可用性。

展开

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值