在集群环境中,一台主Master机器会管理好几台slave机器,Master机器的一个重要功能是如何在运行过程中监视slave机器的运行异常状态,如网络断链,系统崩溃,从而对这些异常状态进行处理。采取的方式是心跳检测。
心跳检测有2种: 主动和被动
主动是指Master节点定时向所有节点发送心跳检测请求,所有节点响应后返回一个状态码,如某些节点返回异常或失败的状态码,则master认为此台机器处于异常状态,将会自动停止该台服务响应应用请求,并向管理员发告警邮件
被动是指slave节点定时向master节点汇报自己的状态,如在指定的时间间隔内,master没有收到某节点的汇报信息,master就认为此节点处于异常状态.
实现方式其实就是定时(时间间隔看应用需要,一般都是很短)远程服务调用。第一种方法是直接调用,根据返回信息来判断,第2种是 根据最近一次的汇报状态与当前的时间差,如超过规定的时间则认为异常
心跳检测
最新推荐文章于 2021-04-05 22:49:19 发布