健康检查
健康检查是在服务注册的时候开启的。服务注册时会调用到com.alibaba.nacos.naming.core.Service#init
service.init(); --> HealthCheckReactor.scheduleCheck(clientBeatCheckTask); 这个东东就是健康检查了。 搞了一个定时任务,延时5s执行,然后每隔5s一次。
public static void scheduleCheck(ClientBeatCheckTask task) {
futureMap.putIfAbsent(task.taskKey(), GlobalExecutor.scheduleNamingHealth(task, 5000, 5000, TimeUnit.MILLISECONDS));
}
我们来看下这个定时任务com.alibaba.nacos.naming.healthcheck.ClientBeatCheckTask#run
1.获取所有的实例
2.判断最后一次心跳时间是否超过了15s
3.如果超时了,则将健康状态设置为false
再往下看,还有一个for循环,如果超过30s没有发送心跳了会删除实例
集群模式下的健康检查
集群模式下,每个服务的心跳只会在一个服务器上进行检查然后同步给其他服务器。
我们在回头看下com.alibaba.nacos.naming.healthcheck.ClientBeatCheckTask#run
之前我们跳过了开始的这两块代码,现在我们回过头来再看看。
getDistroMapper().responsible中取出serviceName,然后进行散列运算,在对服务节点的数量取模。然后进行了一个条件判断。只有符合条件的才会继续ClientBeatCheckTask#run后续的逻辑。这样就对服务器的节点进行了过滤,只有一台才能执行健康检查。
int index = servers.indexOf(EnvUtil.getLocalAddress());
int lastIndex = servers.lastIndexOf(EnvUtil.getLocalAddress());
if (lastIndex < 0 || index < 0) {
return true;
}
int target = distroHash(serviceName) % servers.size();
return target >= index && target <= lastIndex;
if (!getDistroMapper().responsible(service.getName())) {
return;
}