HDFS的角色与工作原理

riwanba

已于 2022-11-18 13:08:04 修改

阅读量474

点赞数 1

文章标签： hdfs hadoop 大数据

于 2022-10-17 23:34:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/riwanba/article/details/127379569

版权

HDFS的角色

一个Master: NameNode

NameNode负责存储元数据,以树形结构储存目录,但是block块位置不会长久保存,每次开机需要重新获取block块位置(由DataNode汇报给NameNode)

多个Slave: DataNode

负责储存数据,一个大文件会被切分成多个block块,每块128M,并且会有三份副本,保证数据安全

SecondaryNameNode:

负责辅助NameNode处理元数据

HDFS的元数据管理

由于HDFS中元数据全部存储在一个NameNode的内存中,一旦发生单点故障整个集群的元数据就会丢失,导致集群无法使用,所以有 fsimage(保存元数据信息,在磁盘中)和edits(保存数据操作信息,在磁盘中)来保证元数据不会丢失,断电后只需将edits和fsimage合并即可得到元数据,为了保证该过程的效率,引入了secondaryNameNode,以下为该过程(checkpoint)流程:

1.进行元数据操作时,会将操作记录在edits中,当edits存储操作条数达到一百万或者checkpoint过程间隔达到一小时则会将edits发送给SecondaryNameNode,并且将新产生的操作数据写入新的edits

2.SecondaryNameNode收到edits后将自身储存的fsimage和发送过来的edits加载到内存中进行合并,合并后产生新的fsimage覆盖原本储存的fsimage,并将新产生的fsimage发送给NameNode

3.NameNode收到新的fsimage后将旧的覆盖

因为checkpoint过程的存在如果发生断电,NameNode只需要将自身的edits和fsimage合并即可得到完整的元数据信息

HDFS写流程

1.client端向NameNode发送写入请求

2.NameNode检查文件是否存在,用户是否有操作限权,通过检查后返回第一个block块的储存位置列表

3.client端收到储存位置列表后形成pipeline,将bleock块分成64k的packet进行传输,client端发送给第一个DataNode,第一个DataNode链接并发送给第二个DataNode,第二个链接并发送给第三个DataNode

4.重复以上步骤直到第一个block块传输完成,重复申请写操作直到文件传输完成

HDFS读操作

1.client端向NameNode请求读取数据

2.NameNode检查文件是否存在,用户是否有操作限权,检查通过后将第一个block块存储位置发送给client端

3.client端根据拓扑原理从距离最近的DataNode读取block块数据

4.重复以上操作直到文件传输完成,最后将所有block块合并成一个完整文件

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

riwanba CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

136万+: 周排名

142万+: 总排名

1万+: 访问

: 等级

210: 积分

3: 粉丝

8: 获赞

4: 评论

47: 收藏

私信

关注

热门文章

最新评论

finalshell 连接出现channel is not opened问题
CSDN-Ada助手: 恭喜您写了第19篇博客！看到您解决了finalshell连接中出现的"channel is not opened"问题，我感到非常高兴。您的经验分享对其他用户来说一定非常有帮助。在接下来的创作中，我建议您可以继续分享一些关于finalshell的高级技巧或者更深入的使用案例。这样可以进一步拓宽读者的视野，帮助他们更好地应对各种可能遇到的问题。谦虚地说，我相信您在这个领域的知识和经验还有很多可以分享的。期待您的下一篇博客！祝您继续创作的过程中愉快并取得更大的成功！
selenium 下 chrome 和 chromedriver的版本保持
CSDN-Ada助手: 恭喜您写了第19篇博客！标题中提到的"版本保持"非常重要，对于使用selenium和chromedriver的开发者来说是一项关键任务。您的博客内容无疑会帮助到很多人解决这个问题。不过，如果您愿意，我想提供一些建议来丰富您的创作。下一步，您可以考虑探讨如何在不同操作系统和浏览器版本中保持selenium、chrome和chromedriver的兼容性。这个话题也是开发者们面临的挑战之一，他们会非常乐意看到您的经验和建议。另外，您还可以分享一些实际的案例和解决方案，以帮助读者更好地理解和应用这些技术。再次恭喜您，并期待您在未来的博客中分享更多有价值的内容！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply19 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。