memcached的分布式:
服务器端没有“分布式功能”,分布式完全由客户端程序实现,这是memcached分布式最大特点。
memcached分布式原理:
向memcached添加A,将A传给客户端程序库,客户端算法根据键决定保存数据的服务器;获取时也先获取键A传递给函数库,通过与保存时算法,就能选中保存时服务器,发送get命令,只要数据没有被删除,就鞥获取数据的值。
好处:将不同键放到不同服务器,实现了memcached的分布式,当服务器增多,键就会分散,即使其中一台出现问题,也不会影响其他的缓存,依然继续运行。
分布式算法:
根据余数分散算法:
就是“根据服务器台数的余数进行分散“,求得键的整数哈希值,再除以服务器台数,根据其余数来选择服务器。
余数计算的方法简单,数据的分散性也相当优秀,但也有其缺点。那就是当添加或移除服务器时,缓存重组的代价相当巨大。添加服务器后,余数就会产生巨变,这样就无法获取与保存时相同的服务器,从而影响缓存的命中率。
Consistent Hashing:
先求出memcached服务器(节点)的哈希值,将其配置到0~232的圆(continuum)上。然后用同样的方法求出存储数据的键的哈希值,并映射到圆上。然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过232仍然找不到服务器,就会保存到第一台memcached服务器上。
添加一台memcached服务器。只有在continuum上增加服务器的地点逆时针方向的第一台服务器上的键会受到影响。
,Consistent Hashing最大限度地抑制了键的重新分布。而且,有的Consistent Hashing的实现方法还采用了虚拟节点的思想。使用一般的hash函数的话,服务器的映射地点的分布非常不均匀。因此,使用虚拟节点的思想,为每个物理节点(服务器)在continuum上分配100~200个点。这样就能抑制分布不均匀,最大限度地减小服务器增减时的缓存重新分布。