聊聊分布式存储系统的Decommission和Maintenance模式

最新推荐文章于 2021-05-08 11:02:16 发布

Android路上的人

最新推荐文章于 2021-05-08 11:02:16 发布

阅读量1.1k

点赞数

分类专栏：分布式系统文章标签： decommission maintenance

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Androidlushangderen/article/details/98887363

版权

本文探讨分布式存储系统中Decommission和Maintenance模式，保证节点故障时的数据高可用性。Decommission涉及节点剔除及数据复制，Maintenance则允许短暂冗余度降低，适用于短期维护。在维护过程中，限流处理至关重要，以防止对系统服务造成影响。

摘要由CSDN通过智能技术生成

文章目录

前言
Decommission模式
Maintenance模式
Decommission/Maintenance过程中的限流处理

前言

在分布式存储系统中，我们经常会遇到节点坏了挂掉的情况。这个时候我们通常的做法是将其进行送修处理。节点出现问题挂了这个现象本身不严重，这里的重点是我们如何依然保证其上数据对于用户的高可用性。这就是我们常说的存储节点的Decommission过程。本文笔者来聊聊Decommission过程以及它的扩展模式Maintenance模式。

Decommission模式

Decommission过程并不是指简单的存储节点停服务下线的操作，而是在节点允许停止服务前的一系列过程，以此保证系统的数据服务免受节点下线所带来的影响。这里的“一系列过程”包括有以下两个方面：

让中心控制节点获知当前节点为即将下线节点，使其从服务节点列表中剔除出去，不让数据读写请求转发到此节点来。
复制当前下线节点中的所有副本数据到其它节点中，保持数据的冗余度。

在上述2个步骤过程中，第二步是主要的过程，也将会耗费最多的时间。等这2个步骤都完成了，我们就可以放心地把节点进行停服务，然后送修处理了。

用一句话来概括Decommission过程的一个核心点：当前节点数据将不可用了，我们需要将此节点数据的副本数重新达到期望的数据副本数。

在Decommission过程中，我们需要将节点上所有的数据进行replication出去的操作，如果节点存储数据的量比较多，这个过程的开销还是比较高的。但有些时候，我们送修的机器可能只需要花少量时间进行修复，然后随后又可以恢复服务状态了，此时这个Decommission的操作显然代价有点高了。如果我们能够在保证数据又至少一个副本的可用情况下，允许节点有短暂的维护态

最低0.47元/天解锁文章

Android路上的人

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
聊聊分布式存储系统的Decommission和Maintenance模式

文章目录前言Decommission模式Maintenance模式Decommission/Maintenance过程中的限流处理前言在分布式存储系统中，我们经常会遇到节点坏了挂掉的情况。这个时候我们通常的做法是将其进行送修处理。节点出现问题挂了这个现象本身不严重，这里的重点是我们如何依然保证其上数据对于用户的高可用性。这就是我们常说的存储节点的Decommission过程。本文笔者来聊聊D...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。