负载均衡算法

背景:随着互联网的快速发展和演进,当系统达到一定规模,应用之间相互交互、互相调用便不可避免,为了防止重叠业务的重复实现,此时将相对核心的业务抽取出来,作为单独的系统对外提供服务,达到业务之间相互复用,系统也因此演变成为分布式应用架构体系。分布式系统所要面临的首要问题,便是如何实现应用之间的远程调用(RPC),以及当服务越来越多时,如何实现服务的负载均衡?

对于负载较高的服务来说,往往对应着由多台服务器组成的集群。在请求到来时,为了将请求均衡地分配到后端服务器,负载均衡程序将从服务对应的地址列表中,通过相应的负载均衡算法和规则,选取一台服务器进行访问,这个过程称为服务的负载均衡,如下图:


当服务的规模较小时,可以采用硬编码的方式将服务地址和配置写在代码中,通过编码的方式来解决服务的路由和负载均衡,也可通过传统的硬件负载均衡设备如F5等,而当服务越来越多,规模越来越大时,对应的机器数量也越来越庞大,单靠人工来管理和维护服务及地址的配置信息,已经越来越困难,此时,需要一个能够动态注册和获取服务信息的地方,来统一管理服务名称和其对应的服务器列表信息,称之服务配置中心,服务配置中心的核心,则是负载均衡算法。

负载均衡的算法种类很多,常见的负载均衡算法包括轮询法、随机法、源地址哈希法、加权轮询法、加权随机法、最小连接法等,应根据具体使用场景选取对应的算法。

1. 轮询法(Round Robin)

轮询法很容易理解,将请求按顺序轮流地分配到后端服务器上,它均衡的对待后端每一台服务器,而不关心服务器实际的连接数和当前的系统负载。

这里通过初始化一个serverWeightMap的变量来表示服务器地址和权重的映射,以此来模拟各负载均衡算法的实现:

/**
 * 负载均衡算法
 * @author yejianwen 
 *
 */
public class LoadBalancingAlgorithm
{
    public static HashMap<String, Integer> serverWeightMap = null;
    private static Integer pos = 0;
    
    static {
        serverWeightMap = new HashMap<String, Integer>();
        serverWeightMap.put("192.168.1.100", 1);
        serverWeightMap.put("192.168.1.101", 1);
        serverWeightMap.put("192.168.1.102", 2);
        serverWeightMap.put("192.168.1.103", 1);
        serverWeightMap.put("192.168.1.104", 4);
        serverWeightMap.put("192.168.1.105", 3);
        serverWeightMap.put("192.168.1.106", 2);
        serverWeightMap.put("192.168.1.107", 1);
    }
    
    /**
     * 负载均衡--轮询算法
     * @return
     */
    public static String roundRobin() {
        //重新创建一个Map,避免出现由于服务器上线和下线导致的并发问题
        Map<String, Integer> serverMap = new HashMap<String, Integer>();
        serverMap.putAll(serverWeightMap);
        
        //获得IP地址list
        Set<String> keySet = serverMap.keySet();
        ArrayList<String> keyList = new ArrayList<String>();
        keyList.addAll(keySet);
        
        String server = null;
        synchronized (pos) {
            if(pos >= keySet.size()) {
                pos = 0;
            }
            server = keyList.get(pos);
            pos ++;
        }
        
        return server;
    }
}

其中IP地址192.168.1.102的权重为2,192.168.1.105的权重为3.

由于serverWeightMap中的地址列表是动态的,随时可能有机器上线、下线或者宕机,因此,为了避免可能出现的并发问题,通过新建方法内的局部变量serverMap,先将域变量复制到线程本地,以避免被多个线程修改。这样可能会引入新的问题,复制以后serverWeightMap的修改将无法反映给serverMap,也就是说,在这一轮选择服务器的过程中,新增或者下线服务器,负载均衡算法中将无法获得,新增比较好处理,而当服务器下线或者宕机时,服务消费者将有可能访问到不存在的地址。因此,在服务消费者的实现端需要考虑该问题,并且进行相应的容错处理,比如重新发起一次调用。

对于当前轮询的位置变量pos,为了保证服务器选择的顺序性,需要在操纵时对其加上synchronized锁,使得在同一时刻只有一个线程能够修改pos的值,否则当pos变量被并发修改,则无法保证服务选择的顺序性,甚至可能导致keyList数组越界。

使用轮询侧绿的目的在于,希望做到请求转移的绝对均衡,但付出的性能代价也是相当大的。为了保证pos变量修改的互斥性,需要引入重量级悲观锁synchronized,将会导致该段轮询代码的并发吞吐量明显的下降。

2. 随机法(Random)

通过系统随机函数,根据后端服务器列表的大小值来随机选取其中一台进行访问。由概率统计理论可以的得知,随着调用量的增大,其实效果越来越接近于平均分配流量到每一台服务器,也就是轮询的效果。随机算法的部分关键代码如下:

/**
     * 负载均衡--随机法
     * @return
     */
    public static String random() {
        //重新创建一个Map,避免出现由于服务器上线和下线导致的并发问题
        Map<String, Integer> serverMap = new HashMap<String, Integer>();
        serverMap.putAll(serverWeightMap);
        
        //获得IP地址list
        Set<String> keySet = serverMap.keySet();
        ArrayList<String> keyList = new ArrayList<String>();
        keyList.addAll(keySet);
        
        Random random = new Random();
        int randomPos = random.nextInt(keyList.size());
        
        String server = keyList.get(randomPos);
        return server;
    }

当前,跟前面类似,为了避免可能出现的并发问题,需要将serverWeightMap复制到serverMap中。通过Random的nextInt方法,取到在0~keyList.size()区间的一个随机整数,从而从服务器列表中随机获取到一台服务器地址,进行返回。基于概率论知识,吞吐量越大,随机算法的效果越接近轮询算法的效果,因此,你还会考虑一定要使用需要付出一定性能代价的轮询算法吗?

3. 源地址哈希法(hash)

源地址哈希的思想是获取客户端的IP地址值,通过哈希函数计算得到一个数值,用该数值对服务器列表的大小进行取模运算,得到的结果便是要访问的服务器序号。采用哈希法进行负载均衡,同一个IP地址的客户端,当后端服务器列表不变时,它每次都会被映射到同一台后端服务器进行房访问。

/**
     * 负载均衡--源地址哈希算法
     * @return
     */
    public static String comsumerHash(String remoteip) {
        //重新创建一个Map,避免出现由于服务器上线和下线导致的并发问题
        Map<String, Integer> serverMap = new HashMap<String, Integer>();
        serverMap.putAll(serverWeightMap);
        
        //获得IP地址list
        Set<String> keySet = serverMap.keySet();
        ArrayList<String> keyList = new ArrayList<String>();
        keyList.addAll(keySet);
        
        int hashCode = remoteip.hashCode();
        int serverListSize = keyList.size();
        int serverPos = hashCode % serverListSize;
        
        return keyList.get(serverPos);
    }

4. 加权轮询法(Weight Round Robin)

不同的后端服务器可能机器的配置和当前系统的负载并不相同,因此他们的抗压能力也不尽相同,给配置高、负载低的机器配置更高的权重,让其处理更多的需求,而低配置、高负载的机器,则给其分配较低的权重,降低其系统负载。

/**
     * 负载均衡--加权轮询算法
     * @return
     */
    public static String weightRoundRobin() {
        //重新创建一个Map,避免出现由于服务器上线和下线导致的并发问题
        Map<String, Integer> serverMap = new HashMap<String, Integer>();
        serverMap.putAll(serverWeightMap);
        
        //获得IP地址list
        Set<String> keySet = serverMap.keySet();
        Iterator<String> it = keySet.iterator();
        
        ArrayList<String> serverList = new ArrayList<String>();
        
        while(it.hasNext()) {
            String server = it.next();
            Integer weight = serverMap.get(server);
            for(int i = 0; i < weight; i++) {
                serverList.add(server);
            }
        }
        
        String server = null;
        synchronized (pos) {
            if(pos >= keySet.size()) {
                pos = 0;
            }
            server = serverList.get(pos);
            pos ++;
        }
        
        return server;
    }

与轮询算法类似,只是在获取服务器地址之前增加了一段权重计算的代码,根据权重的大小,将地址重复的增加到服务器地址列表中,权重越大,该服务器每轮所获得的请求数量越大。

5. 加权随机法(Weight Random)

与加权轮询法类似,加权随机法也根据后端服务器不同的配置和负载情况,配置不同的权重。不同的是,它是按权重来随机选取服务器的,而非顺序。

/**
     * 负载均衡--加权随机法
     * @return
     */
    public static String weightRandom() {
        //重新创建一个Map,避免出现由于服务器上线和下线导致的并发问题
        Map<String, Integer> serverMap = new HashMap<String, Integer>();
        serverMap.putAll(serverWeightMap);
        
        //获得IP地址list
        Set<String> keySet = serverMap.keySet();
        Iterator<String> it = keySet.iterator();
        
        ArrayList<String> serverList = new ArrayList<String>();
        
        while(it.hasNext()) {
            String server = it.next();
            Integer weight = serverMap.get(server);
            for(int i = 0; i < weight; i++) {
                serverList.add(server);
            }
        }
        
        Random random = new Random();
        int randomPos = random.nextInt(serverList.size());
        
        String server = serverList.get(randomPos);
        return server;
    }


6. 最小连接数法(Least Connections)
    最小连接数法算法比较灵活和智能,由于后端服务器的配置不尽相同,对于请求的处理有快有慢,它正是根据后端服务器当前连接数情况,动态的选取其中当前积压连接数最少的一台服务器来处理当前请求,尽可能地提高后端服务器的利用效率,将负载合理地分流到每一台机器。由于最小连接数涉及服务器连接数汇总和感知,设计与实现较为繁琐,此处,不做细说。

负载均衡的算法介绍到此。

参考文献:阿里总架构师 陈康贤 所著《大型分布式网站架构设计与实践》



  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值