Ozone Data Scrubbing机制

最新推荐文章于 2023-09-06 16:27:32 发布

Android路上的人

最新推荐文章于 2023-09-06 16:27:32 发布

阅读量650

点赞数

分类专栏：分布式系统 Ozone 文章标签： data scrubbing ozone

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Androidlushangderen/article/details/96383478

版权

本文介绍了Hadoop Ozone的Data Scrubbing机制，用于主动检测和修复数据损坏。Data Scrubbing通过周期性的数据检查，包括内存、磁盘元数据对比和实际数据内容一致性检查，确保数据健康。当检测到损坏，Container会被标记为Unhealthy，并触发SCM的副本复制操作以恢复数据冗余。Ozone的ContainerScanner和ChunkScanner分别执行粗粒度和细粒度的自检任务。

摘要由CSDN通过智能技术生成

文章目录

前言
数据的损坏
Ozone的Data Scrubbing机制
引用

前言

在大规模的分布式存储系统中，数据是分布式地存储在不同的存储节点中。在节点数量达到比较大规模的时候，出现数据损坏的情况就会变得十分的常见了。数据节点出现数据损坏是很常见的现象，我们不能保证它是绝对完美的，因此我们的一个目标是使数据损坏对系统的影响降到最低甚至没有影响。这里其实就谈到了系统对于异常数据的处理机制了，相对于系统被动式地感知数据的损坏（用户访问行为错误触发），主动式的数据自检行为无疑是一种更好的解决办法。本文笔者就来聊聊Hadoop Ozone内部的数据自检服务Data Scrubbing服务，从原理上来说类似于HDFS BlockScanner和VolumeScanner的服务。

数据的损坏

首先我们来说说数据的损坏。一个磁盘数据的损坏会有很多可能的引发原因，包括软件层面的或者是硬件层面的，比如以下几类：

硬件层面的问题，比如磁盘驱动问题等。
磁盘的Bit rot位衰减问题。
文件系统lost write问题，比如实际内容已经写入磁盘，但在文件系统层面认为没有写入。或者是相反的情况。

当然，引发上述3类磁盘问题的影响因素也会有很多，比如：

磁盘的使用时间
磁盘的类型，比如企业级磁盘，或者近线性磁盘
磁盘数据的本地性访问等等
…

当然以上种种因素导致磁盘数据损坏的情况时，我们如何能够快速地检测出来呢？我们继续往下看。

Ozone的Data Scrubbing机制

最低0.47元/天解锁文章

Android路上的人

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。