分布式键值系统Dynamo & Tair

最新推荐文章于 2022-10-24 22:54:42 发布

爱吃草莓的西瓜酱

最新推荐文章于 2022-10-24 22:54:42 发布

阅读量350

点赞数

分类专栏：数据库文章标签：数据库 Dynamo

本文链接：https://blog.csdn.net/weixin_41045344/article/details/108603115

版权

6 篇文章 0 订阅

订阅专栏

Question

选择最终一致性，因为强一致性会影响数据的高可用性。也就是说高可用性和一致性两者间必须要做一个trade-off，联想到CAP理论中，只考虑AP和CP。（可能P2P模式下，很难保证强一致性）
Dynamo采用最终一致性，不会阻拦别的事务的写操作，因为无需复制完所有的副本才可以进行写操作。这里将冲突的复杂解决方法推到reads上，确保写不会被拒绝。
支持强一致性的系统不能很好处理网络分区问题
但是Tair却不是这样的，它选择了强一致性（因为它有），它认为Dynamo牺牲了一致性却没有换来什么好处。

一般考虑在data store还是application中解决，在data store（常用）中解决的话只能用一些很简单的方法，如last write wins；而在application中解决的话，就能结合应用的特性和data schema来综合考虑进行解决（比如合并冲突版本啥的）

在这里插入图片描述

get(key): returns a single object or a list of objects with conflicting versions along with a context.
put(key,context,object) : context和object存在一起是为了能确认put请求提供的context obect的有效性（具体context中的内容是什么，不是很清楚）

改进一致性哈希算法
传统的一致性哈希算法的问题：节点是在ring上随机分布的，这样会导致数据和负载分布不均衡；无视每个节点的性能会存在差异（Dynamo根据不同节点的性能给予不同数据的token，可认为这个是虚拟节点。物理节点与虚拟节点之间是 1：n的关系）
使用虚拟节点的好处：当一个节点不可用的时候，它的节点负载会被剩下的节点均衡分配；出现一个新节点，也会平均接受来自其他可用节点的负载； 1：n 中的n可用根据该物理节点的性能来进行设置。

每个数据项都被保存在N个主机上，假定key经过分区算法被分配到节点1上，那么1~N都会保存该key。由于存在虚拟节点，可能物理节点不满N个，通过构建skipping positions来解决这一问题（不太理解这一点）。
参数N：per-instance
存储key的节点list： perference list

注：大致了解这篇论文后，我要弃了，还不如看看基础的分布式知识，太耗时间了。。

关注