hdfs 是hadoop 生态系统的一部分,为大数据的处理提供了分布式的存储环境。
hdfs的四大机制和两大核心:
hdfs 提供的是高容错性的分布式的数据存储方案,
四大机制
hadoop集群启动的时候各个进程启动的顺序
namenode:
datanode
secondarynamenode
心跳机制
集群节点之间必须做时间同步
- namenode负责集群上任务的分工,如果要进行分工,则必须直到各个从节点的存活状况,namenode通过datanode定期向namenode发送的心跳报告得知的,datanode默认每隔3秒发送一次心跳报告
namenode什么时候才会判定datanode死了
- datanode每隔3秒向namenod