基于官方的 Nacos Sync 做任务分片和集群高可用,目标是为了支持大规模的注册集群迁移,并保障在节点宕机时,其它节点能快速响应,转移故障。技术点如下,文中只列出部分源码或者以伪代码表示:
**详细代码,请参考:
https://github.com/zhangmen-tech/nacos**
服务一致性 Hash 分片路由:
根据如图1多集群部署,为每个节点设置可配置的虚拟节点数,使其在 Hash 环上能均匀分布。
// 虚拟节点配置
sync.consistent.hash.replicas = 1000;
// 存储虚拟节点
SortedMap circle = new TreeMap();
// 循环添加所有节点到容器,构建Hash环
replicas for loop {
// 为每个物理节点设置虚拟节点 String nodeStr = node.toString().concat("##").concat(Integer.toString(replica)); // 根据算法计算出虚拟节点的Hash值 int hashcode = getHash(nodeStr); // 将虚拟节点放入Hash环中 circle.put(hashcode, node);
}
// 异步监听节点存活状态
etcdManager.watchEtcdKeyAsync(REGISTER_WORKER_PATH, true, response -> {
for (WatchEvent event : response.getEvents()) { // 删除事件,从内存中剔除此节点及Hash中虚拟节点 if (event.getEventType().equals(WatchEvent.EventType.DELETE)) { String key = Optional.ofNullable(event.getKeyValue().getKey()).map(bs -> bs.toString(Charsets.UTF_8)).orElse(StringUtils.EMPTY); //获取Etcd中心跳丢失的节点 String[] ks = key.split(SLASH); log.info("{} lost heart beat", ks[3]); // 自身节点不做判断 if (!IPUtils.getIpAddress().equalsIgnoreCase(ks