举个例子,在负载均衡中,需要在服务器列表中选择一个服务器。那么,如何选择呢?
我们可以round robin,即轮询策略,第一次把请求包分给1号服务器,第二次把请求包分给2号服务器。。。。。。这种策略比较简单,好理解,不过较为死板,没有考虑别的因素,是比较简单的均衡。
接下来,我们介绍一种比较好的策略–一致性哈希。
一致性哈希理解起来并不困难,我们把服务器散列在一个圆环上,然后选择服务器的时候,从圆环上某一点开始,顺时针找最近的一个点,就是要找的服务器。
这里,我们遇到几个问题,如何制造一个圆环?服务器如何散列在圆环上才比较均匀?
我们可以选取32位整形来表示一个圆环,采用hash来让服务器更均匀的散列。
给大家画一个简单的图讲解一下:
首先我们需要把服务器部署在圆环上:
将服务器hash后得到hash值,插入进圆环(即插入map中)
对于请求来说:
1.每个客户端首先进行hash获得一个在圆环上的位置
2.从当前位置开始顺时针找第一个大于等于其hash值得节点(这个过程在map里实现,后边代码部分可以看到)
3.找到对应节点,获取其对应值即可
这样的另一个好处就是可以顺带实现会话保持,因为客户端的hash值是固定的,所以,只要上次发送的那个服务器没有宕机,每次都是找到的都是相同的服务器。
OK,我们的目的就是负载均衡,到此已经大体实现了。
但是,还是有一个小小的问题,就是,如果部署的多个服务器的hash值比较相近,那么比较靠前的服务器的压力比较大,其后边的邻近服务器可能分配到很少的连接。
给大家画图来帮助理解:
可以看到,服务器4、5、6很难分配到连接
所以,我们将引入虚拟节点。
虚拟节点很好理解,就是一个服务器在圆环上部署多个节点,这样,只要节点分布的均匀,请求的分发可以很好的照顾到每一个服务器
效果如图:
接下来是我用C++的代码实现,注释比较详细,可以放心看。
#include<iostream>
#include<map>
#include<stdlib.h>
#include<time.h>
using namespace std;
class CHash
{
public:
CHash(){}
~CHash(){}
//封装一个hash接口
unsigned int hash(int addr)
{
return MurMurHash((const void *)&addr, sizeof(addr));
}
private