一致性hash以及python代码实现

背景:自己之前的项目里面使用了redis作为KV存储,不仅是因为性能,主要是需要用redis的hash数据结构。后来随着业务发展,读写压力越来越大,一开始的做法是读写分离,接着一主多从,发现还是不能很好的解决写redis的压力,又因为自己使用的redis版本比较低还不支持分布式的功能,所以自己想去部署一套分布式的redis存储系统,开始想到的做法是简单的做个hash,hashcode=hash(key/machine_num),接着将对应的key放在对应的机器,可是考虑到机器异常宕机,或者新增机器,数据迁移的代价都比较大,所以自己了解了一下一致性hash,准备用它实现一套分布式的KV存储系统。

主要思想:
一致性hash的经典介绍网上有很多,我感觉下面这篇文章介绍的不错。

http://blog.csdn.net/cywosp/article/details/23397179/

其实主要的思想我认为如下:

  • 把机器按照某种hash算法(比如MD5)计算得到机器的hashcode值
  • 对于存储的数据,根据数据的key,使用与机器相同的hash算法获取到相应的hashcode值,然后将key写入到顺时针最近的机器。
    可以是hashcode(key) <= hashcode(machine)的机器
  • 当有新机器加入时,只需要把新加入机器影响到的数据进行重新分配;当删除机器时,只需要把被删除机器的数据重新分配一下,这样可以减小数据的迁移代价。
  • 为了维持平衡性,防止雪崩效应,使用虚拟节点代替真实机器,一个真实机器对应多个虚拟节点,这样可以保证数据的分布均衡

下面是Python的代码实现,实现思路就是上面提到的。
代码也是参考网上的:
http://www.cnblogs.com/xuxm2007/archive/2011/08/28/2156015.html

   #! /usr/bin/env python
    # -*- coding:utf8 -*-

    import md5

    
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值