hadoop的三大机制介绍

最新推荐文章于 2023-12-14 10:17:13 发布

hello_alldatabase

最新推荐文章于 2023-12-14 10:17:13 发布

阅读量512

点赞数

分类专栏：其他

本文链接：https://blog.csdn.net/weixin_41561946/article/details/112723442

版权

其他专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文详细介绍了Hadoop大数据中HDFS的心跳机制，包括datanode与namenode间的通信间隔、心跳超时判断标准以及如何通过调整配置进行设置。此外，还概述了HDFS的启动过程，从namenode加载元数据到datanode上报块信息。安全模式在部分节点故障时确保集群自我恢复，当丢失数据块比例超过0.1%时会自动触发。最后，讨论了副本存放策略，强调了副本分布的多样性和机架间平衡。

摘要由CSDN通过智能技术生成

背景

最近在学习大数据hadoop篇，为了提高学习效率、巩固学习成果，特此记录一下。

心跳机制

心跳机制：datanode每隔一个固定时间会与namenode进行一次通信，以证明自己是alive同时让namenode知道集群中有多少datanode属于存活状态以及各副本与数据块的分布情况

datanode每隔一个固定时间要发送一个心跳数据包给namenode，如果隔了一段时间namenode没有收到datanode的心跳数据包，那么namenode必须按照一个标准来判断datanode是否真正down了
判断标准：10心跳时间(3秒钟)+2检测心跳机制超时时间（5分钟）=630
可以通过kill 掉一个datanode来观察
在这里插入图片描述

心跳数据包的内容
1、各datanode自身的状态
2、该datanode节点上保存的所有数据块信息
hdfs启动过程
1、先启namenode进程
2、加载namenode文件夹中的磁盘元数据信息（fsimage+edits_inprogress）
3、在namenode启动完成后，会在namenode上启动一个服务，等待所有的datanode上线后向namenode汇报他们的状态和数据块情况。
4、datanode上线后，就通过心跳机制把自身所持有的所有块信息全部汇报给namenode
5、只有当namenode等所有的datanode上线并把所有块信息汇报完成之后，最后namenode才能得知整个集群所有文件对应的数据块及副本情况
6、namenode对外提供服务。

安全模式

在HDFS集群部分datanode出现宕机之后或启动在集群过程中有一些datanode因故障无法正常启动，这里hdfs会在后台启动一些服务，进行自我恢复，这时集群会进入一个种安全模式。
安全模式相关的命令
[root@hadoop0 current]# hdfs dfsadmin --help
-safemode <enter | leave | get | wait>]
补充：当丢失的数据块比例超过0.1%的时候会进行安全模式（怎么得知的）