这篇文章主要就HDFS的四大机制来做一些较为详细的说明。
HDFS的四大机制:心跳机制(heartbeat)、安全模式、副本存放策略(机架策略)、负载均衡。
四大机制
1.心跳机制(heartbeat):
(1)hadoop是一个Master/Slave结构,Master中有NameNode和ResourceManager,Slave中有DataNode和NodeManager;
(2)Master启动的时候会启动一个IPC(Inter-Process Comunication,进程间通信)Server服务,等待Slave的连接;
(3)Slave启动之后,会主动连接Master的IPC Server服务,并且每隔3s连接一次Master。当然了,这个时间间隔是可以调整的(dfs.heartbeat.interval);
(4)NameNode通过心跳来得知DataNode的状态(ResourceManager通过心跳得知NodeManager的状态);
(5)如果Master长时间没有得到DataManager的心跳,就认为DataManager挂掉了。
【注意】
在这个过程中,NameNoder如果长时间没有接收到DataNode的心跳,也会每隔一段时间(5min)向DataNode发送请求,一共会发两次。
默认NameNode向DataNode发送请求的时间间隔为5min,这个时间间隔也是可以修改的,heartbeat.recheck.interval(单位ms)。</

本文深入探讨HDFS的四大关键机制:心跳机制确保DataNode与NameNode间通信,安全模式在数据完整性达到阈值时自动退出,副本存放策略保证数据可靠性与高性能,负载均衡则解决集群资源不均问题。了解这些机制有助于理解HDFS的高效运行。
最低0.47元/天 解锁文章
286

被折叠的 条评论
为什么被折叠?



