概述
本篇文章主要是想讲解清楚dubbo的负载均衡策略,其中文章的内容部分共享自网络,部分来自自己的整理,目的还是跟以往一样,将一个简单的问题讲解清楚。
负载均衡策略及优缺点
Dubbo 负载均衡策略提供下列四种方式:
Random LoadBalance 随机,按权重设置随机概率。 Dubbo的默认负载均衡策略
在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整提供者权重。
RoundRobin LoadBalance 轮循,按公约后的权重设置轮循比率。
存在慢的提供者累积请求问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。
LeastActive LoadBalance 最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。
使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。
ConsistentHash LoadBalance 一致性Hash,相同参数的请求总是发到同一提供者。
当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。
Random负载均衡策略
负载均衡策略也分为权重相同和权重不相同两种情况进行处理,整个代码处理是先计算各个invoker(provider)的权重,判定权重是否相等以及总权重是多少。
如果权重不相等,那么我们就对总权重进行随机取值(通过random.nextInt实现),然后遍历invokers将随机的权重值减去每个invoker的权重,如果得出的结果为负数说明由该invoker提供服务。
如果权重相等,那么就通过random.nextInt()在所有的invoker当中随机选择一个invoker就可以了。
RoundRobin负载均衡策略
轮询负载均衡策略分为权重相同和权重不同两种策略,整个代码遍历所有invoker的权重求出最小最大权重以及权重之和。
针对每个方法,我们会维持一个sequences对象,这个其实就是一个atomic类的整数类型计数。每次进来的时候会循环递增。
针对权重不相同的情况,我们外层循环按照最大权重去循环,内层循环是invoker的个数,这里其实我们要记住由于我们总权重是把所有invoker的权重相加,而循环是拿最大权重*所有invoker的个数,所以后者肯定大于前者。
权重不同的举个例子,假设invoker A权重400,invoker B权重为100,invoker C权重为100,这个时候假设mod为300,那么在遍历A,B,C过程中我们会将mod进行递减,invoker A、B、C递减,最后发现invoker剩余300,最后返回invoker A,这里的关键是递减那部分逻辑很重要。
针对权重相同的情况其实就是我们常见的i++%invoker个数。
LeastActive负载均衡策略
最小active的负载均衡策略也分为有权重和没有权重两种情况,整体思路是每次在所有invoker中获取active最低的个数,然后后面的invoker选择就在最低active的集群当中选择。
有权重和没有权重的最低active选择都是基于上面说的数组,举个例子,假如现在有4个invoker,然后具备最低active的invoker有2个,那么后面我们就在最低active的2个invoker进行选择。
带权重的选择就是根据最低active的权重和随机生成一个随机权重,然后遍历最低active的数目,每次减去invoker的权重,当权重为负数的时候就以该invoker提供服务。
不带权重的选择就是根据最低active的数量通过random.nextInt方式随机返回一个invoker就可以。
ConsistentHash负载均衡策略
一致性hash的负载均衡策略其实就跟一致性hash的原理一样,主要也是分成生成虚拟节点和选择节点提供服务。
首先我们先生成invoker也就是服务接口对应的selector,原则是没有就生成一个。每个invoker虚拟节点的生成的原则很简单:会根据虚拟节点设置的个数/4进行外层循环,以4进行内层循环生成。
其次我们提取请求中携带的参数(因为我们规定了按照哪些参数进行hash)生成hash值,然后选择对应的虚拟节点(如果存在这个hash值),或者选择大于该值的第一个虚拟节点的值,最后去选择对应的invoker。
负载均衡之源码debug
1、先本地启动zookeeper的注册中心
2、直接复用dubbo的源码,我们需要修改provider里面的properties然后启动多个provider,只有多个provider才能调试负载均衡策略。
3、consumer直接进行debug跟踪即可。