研读《高可用多节点集群技术的研究和实现》-----需要研究的关键技术

一 研究相关技术

高可用的集群产品,一直以来作为主机系统的保护方案,通常实现的是双机容错的集群方案,以多节点集群为代表性的多为国外厂商,技术难点是多机环境下的心跳检测机制的设计和故障迁移的设计。在我的论文之以zookeeper技术来实现多机环境下的心跳检测和故障迁移。

1.心跳检测机制

对失效节点的检测,对网络状态,节点状态,软件状态,存储状态进行实时的检测。失效检测是所有高可用的基础。集群系统正常运行以后,系统进入监控的状态,如果检测到集群中有故障节点,立即将故障节点的工作迁移到其他的节点中,但是怎样才能高效的可靠的采集每个节点的信息呢,这需要一个好的模型,使用zookeeper 的watch机制应该可以实现。集群之间通过心跳信号和其他的节点进行通信,获取其他节点的运行状态。

2.故障迁移和故障恢复

故障迁移是指一个节点失效时将系统自动和透明的切换到另一个节点继续提供服务的功能。故障迁移功能是高可用性系统的基础功能,故障恢复是指当失效的节点恢复功能以后重新可用时,将服务迁移到原始的节点的过程。用户可以配置系统,可以自动迁移,也可以手动迁移。有了数据迁移,数据回滚,任务迁移和故障恢复性不但提高了高可用性,而且可以在线系统维护和软件滚动升级,提高系统的可维护性。

3.虚拟服务

集群在工作的时候,都会虚拟出一部分计算机资源,给外部的程序和用户访问,比如虚拟IP和虚拟主机名等等,虚拟提供的服务是集群提供的服务,一个集群可以运行很多的,每个服务都可以有自己的IP和主机名,将其映射到真实的机器上面。这样。每个服务就相当于一台虚拟机,一旦发生了故障,就可以在集群的内部进行故障的转移和恢复。但是在外界看来虚拟服务只不过停顿了一会儿而已,其他的什么都没有改变。

4.网络的负载均衡

网络负载均衡是指集群中的服务器在处理客户端请求的同时,能够根据服务端的空闲程度,自动的转移到负载较小的服务器上面。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值