设计思想赏析-基因算法

这是我的第6篇原创

亲爱的同学们~~~今天给大家介绍一个超牛的解决方案,我第一次知道的时候都惊呆了!这就是~~~

基因 法算

     之前给大家介绍过单表超大的时候,需要分表,一般都是用主键进行hash,或者直接用雪花算法生成全局唯一id,然后按2^n取模,把一张超多数据的表,分成2^n个表。这个时候,问题来了:

如果一个业务里有多个key,例如订单中心,有buyer_id、order_id、seller_id等,我们希望相关的业务都入到同一个库或者同一个表,这样能减少跨库、跨表操作,增加效率。这该怎么办呢?

SX方案设计

彭小贝拍了拍脑袋说:这个简单啊,分库前,先用业务id关联一下分库的那个id,然后就知道在哪个库里了,然后再分出去就好了。

然后彭小贝就因为系统资源开销太大,访问效率极低, 被领导骂了一通,灰溜溜的回家了

彭小贝回到家,掏出钥匙准备打开公寓大门,发现隔壁小美也掏出钥匙正对着他笑。彭小贝愣愣的看着小美手上的钥匙突然想到了什么,转身往公司跑,回身没忘喊了一句“谢谢小美~~~”

设计思路

分库/表策略还得关联表,那肯定是不行的,那怎么做才能直接定位到我们期望的库/表呢?绝对不能等分的时候才去找,那样太慢了。能不能在之前就先定好呢?就像给公寓每个人分配一个大门钥匙那样,有钥匙的就能进公寓,这就不会错了。

彭小贝拿出了雪花算法生成图:

如果我们对一个10进制的数字按10取模,取模的结果与这串数的前面所有位都没有任何关系,最后1位决定取模结果:

MOD(18739,10)=9
MOD(45314321432149,10)=9
MOD(19,10)=9
MOD(666669,10)=9

同理,按100取模,最后2位决定取模结果,按1000取模,最后3位决定取模结果:

MOD(18739,10)=9
MOD(18739,100)=39
MOD(18739,1000)=739

同理:一个二进制的值,按2^n取模,也是最后n位决定取模结果:

MOD(199,16)=7
DEC2BIN(199)=11000111
DEC2BIN(7)=0111

所以能不能把全局唯一用户id的最后几位作为公寓 钥匙一样,其他id生成的时候带上这把钥匙,就能把一个用户的所有数据都放到同一个公寓(库/表)中呢?理论是可以的!

NX方案出炉

彭小贝在雪花算法的图下加入了订单id生成的示意图, 假定需要分16张表,则需要截取二进制订单id的最后LOG(16,2)=4位,作为分库/分表基因。

然后对订单id用hash生成60位,加上从用户id那边获取的4位基因,形成最终的订单id。其他业务id也使用相同的办法处理。

分库/分表策略时,直接设定使用该id进行水平切分。由于所有业务都有相同的最后4位,这样sharding时都会进入相同的库/表。简直太完美了!

彭小贝赶忙拿起手机给小美发了一条感谢的微信~~

你有想对彭小贝说的话,可以先点“在看”,再发表留言

END

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值