【论文阅读】《Chain Replication for Supporting High Throughput and Availability》

最新推荐文章于 2024-05-16 00:01:33 发布

knzeus

最新推荐文章于 2024-05-16 00:01:33 发布

阅读量1.1k

点赞数 1

分类专栏：分布式系统文章标签：链式拷贝强一致性分布式对象存储系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/knzeus/article/details/9180285

版权

分布式系统专栏收录该内容

2 篇文章 0 订阅

订阅专栏

--

论文链接：http://www.cs.cornell.edu/fbs/publications/chainreplicosdi.pdf

--

摘要：针对分布式对象存储系统，满足副本的强一致性，同时支持高吞吐高可用的设计方案。简称链式复制。

文章提出了链式复制的方案，并给出了查询、更新操作的流程，节点故障恢复方案。并和primary backups的方案进行了对比。认为链式复制的方案在吞吐上更优。从文章的实验结论看，应该是在更新操作比例小时，吞吐更优。

从个人理解来看，链式复制在吞吐上并没有优势。更多的是在高可用性上的优势比较明显。

--

系统背景：

1. 分布式对象存储系统

2. 支持对象查询和更新操作

不想数据库这么重量级，又比文件系统支持更多的应用语义。

QoS：

1. 高可用

2. 高吞吐

3. 强一致

api前提：

1. query、update是按某种顺序执行的

2. 更新操作生效后，会被后续的查询感知到

3. 查询操作幂等，更新操作不保证幂等。客户端的更新操作没有收到落地反馈需要重发，客户端不区分发起失败与服务处理失败。由于更新不幂等，客户端需要等待发起的更新操作的反馈，需要控制请求流量。

--

每个几点维护一个历史处理对象id集合Hist{ObjectIds}, 和待处理对象id集合Pending{ObjectIds}。更新请求都发到Head节点，查询请求都发到Tail节点。请求到来append到Pending集合，Tail节点处理完成从Pending集合删除，并加入到Hist集合。

有一个master来管理，master负责：1. 检测故障机器，2. 通知每个机器它的前驱和后继节点， 3. 通知客户端链的Head和Tail节点。

master通过Paxos来协调多个master副本。避免单点故障。

Head节点故障，删除原Head节点，将Head节点的后继作为新的head节点。

Tail节点故障，删除原Tail节点，将Tail节点的前驱作为新的Tail节点。

中间节点S故障，删除S节点，master通知S的后继其前驱改为S的前驱，然后通知S的前驱其后继改为S的后继。

Extending a Chain：故障节点被master从chain中摘除后，为了可靠性，需要扩展chain的节点。选择一个节点T+加入chain的尾部。通知T不再是Tail节点且其后继为T+。T+作为新的Tail节点。后续查询请求发送到T+。

Tail落地后将ack反向返回到head,各层节点更新Hist和Pending 集合。

primary/Backups模型：顺序化请求；客户端请求处理广播到backups，并等待全部非故障的backups的反馈。如果primary挂了，选择一个backup作为新的master。primary返回给client。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】《Chain Replication for Supporting High Throughput and Availability》

--论文链接：http://www.cs.cornell.edu/fbs/publications/chainreplicosdi.pdf--摘要：针对分布式对象存储系统，满足副本的强一致性，同时支持高吞吐高可用的设计方案。简称链式复制。文章提出了链式复制的方案，并给出了查询、更新操作的流程，节点故障恢复方案。并和primary backups的方案进行了对比。认为链式复制的方案在
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。