dubbo负载算法之一致性hash算法_dubbo中的致性hash算法-CSDN博客

本文链接：https://blog.csdn.net/u010833154/article/details/109330877

一致性哈希算法最初用于缓存系统的负载均衡，文章介绍了其工作原理，通过在Dubbo中应用一致性哈希解决数据倾斜问题。在Dubbo中，每个服务提供者被映射为多个虚拟节点，确保请求均匀分布。算法步骤包括创建TreeMap存储节点，根据invocation获取key并进行MD5加密和哈希，从TreeMap中找到最近的节点返回。

摘要由CSDN通过智能技术生成

一致性 hash 算法由麻省理工学院的 Karger 及其合作者于1997年提出的，算法提出之初是用于大规模缓存系统的负载均衡。它的工作过程是这样的，首先根据 ip 或者其他的信息为缓存节点生成一个 hash，并将这个 hash 投射到 [0, 232 - 1] 的圆环上。当有查询或写入请求时，则为缓存项的 key 生成一个 hash 值。然后查找第一个大于或等于该 hash 值的缓存节点，并到这个节点中查询或写入缓存项。如果当前节点挂了，则在下一次查询或写入缓存时，为缓存项查找另一个大于其 hash 值的缓存节点即可。大致效果如下图所示，每个缓存节点在圆环上占据一个位置。如果缓存项的 key 的 hash 值小于缓存节点 hash 值，则到该缓存节点中存储或读取缓存项。比如下面绿色点对应的缓存项将会被存储到 cache-2 节点中。由于 cache-3 挂了，原本应该存到该节点中的缓存项最终会存储到 cache-4 节点中。

一致性 hash 在 Dubbo 中的应用。我们把上图的缓存节点替换成 Dubbo 的服务提供者，于是得到了下图：

这里相同颜色的节点均属于同一个服务提供者，比如 Invoker1-1，Invoker1-2，……, Invoker1-160。这样做的目的是通过引入虚拟节点，让 Invoker 在圆环上分散开来，避免数据倾斜问题。所谓数据倾斜是指，由于节点不够分散，导致大量请求落到了同一个节点上，而其他节点只会接收到了少量请求的情况

上面是一致性hash算法的原理，下面将分析一下dubbo的一致性hash算法

package com.alibaba.dubbo.rpc.cluster.loadbalance;
public class ConsistentHashLoadBalance extends AbstractLoadBalance {
    private final ConcurrentMap<String, ConsistentHashLoadBalance.ConsistentHashSelector<?>> selectors = new ConcurrentHashMap();

    public ConsistentHashLoadBalance() {
    }

    protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) {
        //获取要执行invoker的路径、版本号、方法名作为key
        //cn.xxx.ycloud.database.service.AreaInfoFacade:1.0.0.findList
        String key = ((Invoker)invokers.get(0)).getUrl().