+hadoop\HDFS中NameNode与SecondaryNameNode工作原理

最新推荐文章于 2022-09-06 08:47:01 发布

爱学习的小肥猪

最新推荐文章于 2022-09-06 08:47:01 发布

阅读量289

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/heima201907/article/details/105112722

版权

1）第一阶段：namenode启动

（1）第一次启动namenode格式化后，创建fsimage和edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。

（2）客户端对元数据进行增删改的请求

（3）namenode记录操作日志，更新滚动日志。

（4）namenode在内存中对数据进行增删改查

2）第二阶段：Secondary NameNode工作

（1）SecondaryNameNode询问namenode是否需要checkpoint。直接带回namenode是否检查结果。

（2）SecondaryNameNode请求执行checkpoint。

（3）namenode滚动正在写的edits日志

（4）将滚动前的编辑日志和镜像文件拷贝到Secondary NameNode

（5）SecondaryNameNode加载编辑日志和镜像文件到内存，并合并。

（6）生成新的镜像文件fsimage.chkpoint

（7）拷贝fsimage.chkpoint到namenode

（8）namenode将fsimage.chkpoint重新命名成fsimage

DataNode工作机制

1）一个数据块在datanode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。

2）DataNode启动后向namenode注册，通过后，周期性（1小时）的向namenode上报所有的块信息。

3）心跳是每3秒一次，心跳返回结果带有namenode给该datanode的命令如复制块数据到另一台机器，或删除某个数据块。如果超过10分钟没有收到某个datanode的心跳，则认为该节点不可用。

4）集群运行中可以安全加入和退出一些机器

数据完整性

1）当DataNode读取block的时候，它会计算checksum

2）如果计算后的checksum，与block创建时值不一样，说明block已经损坏。

3）client读取其他DataNode上的block.

4）datanode在其文件创建后周期验证checksum

掉线时限参数设置

datanode进程死亡或者网络故障造成datanode无法与namenode通信，namenode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间为timeout，则超时时长的计算公式为：

timeout = 2 * dfs.namenode.heartbeat.recheck-interval+ 10 * dfs.heartbeat.interval。

而默认的dfs.namenode.heartbeat.recheck-interval大小为5分钟，dfs.heartbeat.interval默认为3秒。

需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒，dfs.heartbeat.interval的单位为秒。

<property>

<name>dfs.namenode.heartbeat.recheck-interval</name>

<value>300000</value>

</property>

<property>

<name> dfs.heartbeat.interval </name>

<value>3</value>

</property>

爱学习的小肥猪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
+hadoop\HDFS中NameNode与SecondaryNameNode工作原理

1）第一阶段：namenode启动（1）第一次启动namenode格式化后，创建fsimage和edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。（2）客户端对元数据进行增删改的请求（3）namenode记录操作日志，更新滚动日志。（4）namenode在内存中对数据进行增删改查...
复制链接

扫一扫

爱学习的小肥猪 CSDN认证博客专家 CSDN认证企业博客

码龄5年

1277: 原创

13万+: 周排名

61万+: 总排名

65万+: 访问

: 等级

1万+: 积分

78: 粉丝

142: 获赞

59: 评论

893: 收藏

私信

关注

热门文章

分类专栏

最新评论

Unity控制台显示C++代码中Log
pythonwait: 请问一下这个无法显示中文是什么原因呢
华为OD两轮技术面试
哒佬: 华为OD机试【2大宝典】再次上新题 ① Python 解华为机试题：https://dream.blog.csdn.net/article/details/129221789 ② C++ 解华为机试题：https://dream.blog.csdn.net/article/details/129472919
python实现文本检索-文本相似度算法
不会NLP: 能分享一下源码吗？谢谢
一文看懂马尔科夫过程
荣华.岁月: 博主，看不到图呀
浅析网站性能
liugang0605: 系统网站应用出现过卡顿，但却不知道如何优化。国内第一篇讲如何减少卡顿的代码级别详细文章，也是性能优化系列文章中的一篇，欢迎点赞、关注，也欢迎对其中的内容进行评论。 https://juejin.cn/post/7159807927908302884 史上最全的火焰图详解，一文让你读懂什么是火焰图前世今生，巧用工具来快速分析性能情况，便捷实现系统调优。 https://juejin.cn/post/7157519564828311583

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。