心跳机制(没有耐心看完,你也不配学会!)
1.心跳机制(heart+beat)
问题1:hdfs集群中namenode负载管理所有的datanode,namenode如何管理?
问题2:怎么获取datanode存活的状况的?
解析:通过心跳策略获取的,datanode在集群运行的过程中会定期的向namenode发送自己的心跳报告,目的是报告namenode自己的存活状态。
心跳报告的周期参数如下图(hdfs-default.xml):
- 629行中,interval是间隔的意思
- 631行中,in 后面跟着单位seconds为妙
从图中可以领悟的,datanode每隔3妙回想namenode发送一个心跳报告
如果一个datanode宕机了,namenode通过多长时间断定?
考虑到这儿情况,打个比方,某人休克了,暂时停止了呼吸,那你能说这个人死亡了吗?肯定不能丫!那到底怎么断定呢?
namenode连续10次接受不到datanode的心跳报告的时候,会认为当前datanode可能宕机了,这其中要注意到连续这个词,就是说一次为3妙,10此就是30妙,当你检测到第20秒的时候,还没有接收到,但是第