【Hadoop|HDFS篇】DataNode概述

Vez'nan的幸福生活

已于 2024-09-07 19:35:11 修改

阅读量540

点赞数 5

文章标签： hadoop hdfs 大数据

于 2024-09-06 21:08:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80912559/article/details/141968711

版权

1. DataNode的工作机制

1）一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。

2）DataNode启动后向NameNode注册，通过后，周期性（6h）的向NameNode上报所有块信息。

DN向NN汇报当前解读信息的时间间隔，默认6小时。

DN扫描自己节点块信息列表的时间，默认为6小时。

3）心跳是每3s一次，心跳返回的结果带有NameNode给该DataNode的命令如复制块数据到另一台机器上，或删除某个数据块，如果超过10分钟没收到某个DataNode的心跳，NameNode认为该DataNode挂掉了。信息不会存储在该DataNode上了。

如图：

我把hadoop104这台机器停掉了，超过了10分种加三十秒没向hadoop102发送心跳，NameNode则认为我这台机器挂掉了。以后Block不会存储在这个节点上了。但能不能恢复呢。是可以的。开启hadoop104并输入命令hdfs --daemon start datanode.

2. 数据的完整性

思考：如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号（1）和绿灯信号（0）.但是存储该数据的磁盘坏了，一直显示是绿灯，是否很危险呢？同理DataNode节点上的数据损坏了，但没有发现，是否也很危险呢？该如何解决呢？

如下是DataNode节点保证数据完整性的方法：

当DataNode读取Block时，它会计算CheckSum校验和。
如果计算后的校验和与Block创建的时候的值不一样，说明Block已经损坏。
Client读取其他DataNode上的Block。
常见的校验算法crc（32），md5（128），shal（160）.
DataNode在其文件创建后周期验证CheckSum。

3. DataNode掉线时参数设置

1. DataNode进程死亡或者网络故障造成DataNode无法与NameNode通信。

2. NameNode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂停称作超时时长。

3. HDFS默认的超时时长为10分钟+30s。

如果定义超时时间为TimeOut，则超时时长的计算公式为：

TimeOut = 2*dfs.namenode.heartbeat.recheck-interval + 10*dfs.heartbeat.interval。

而默认的dfs.namenode.heartbeat.recheck-interval大小为5分钟，dfs.heartbeat.interval默认为3s。

绿色框框的表示2s前向NameNode发送心跳。

Vez'nan的幸福生活

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Vez'nan的幸福生活 CSDN认证博客专家 CSDN认证企业博客

码龄1年

247: 原创

2750: 周排名

6571: 总排名

13万+: 访问

: 等级

5445: 积分

1924: 粉丝

2922: 获赞

81: 评论

1387: 收藏

私信

关注

热门文章

最新评论

【力扣 | SQL题 | 每日四题】力扣1571， 1715， 1699， 1445， 1495， 1683
穷苦书生_万事愁: 博主的这篇“【力扣 | SQL题 | 每日四题】力扣1571， 1715， 1699， 1445， 1495， 1683-CSDN博客”文章内容真是让我受益匪浅。博主独特的见解和细致的解说，让我对SQL题有了全新的认识，收获颇丰。文章中的细节描写非常到位，展现了博主扎实的专业功底和丰富的经验。期待博主未来能够继续分享更多优质的文章，也希望能够得到博主的指导和帮助，共同进步。非常感谢博主的无私分享和支持！
【力扣 | SQL题 | 每日四题】力扣1440, 1378, 1421, 1393, 1407
2401_87541965: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【力扣 | SQL题 | 每日四题】力扣2082， 2084， 2072， 2112， 180
穷苦书生_万事愁: 博主的文章内容丰富、深入，对题目进行了详细的解析，让我对SQL题有了更深入的了解，受益匪浅。博主的文章能帮助我提高解题的能力，让我感受到了博主的专业性和热情。期待博主继续分享更多有价值的内容，为读者带来更多帮助和启发。谢谢博主的辛勤付出和分享，真心期待与博主共同进步！
【数据结构与算法 | 每日一题 | 力扣篇】力扣1184
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【数据结构与算法 | 搜索二叉树篇 && 力扣篇】力扣530， 501
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。