【hadoop】关于HDFS的四大机制与两大核心

本文详细介绍了Hadoop HDFS的四大机制(心跳机制、安全模式、机架策略、负载均衡)和两大核心(上传、下载)。在心跳机制中,解释了如何判断DataNode的生死;安全模式涉及元数据加载与集群启动;机架策略描述了副本存放逻辑;负载均衡确保数据在节点间均匀分布;最后,文章阐述了文件上传和下载的具体步骤及其异常处理策略。
摘要由CSDN通过智能技术生成


hdfs 是hadoop 生态系统的一部分,为大数据的处理提供了分布式的存储环境。

hdfs的四大机制和两大核心:
hdfs 提供的是高容错性的分布式的数据存储方案,

四大机制

hadoop集群启动的时候各个进程启动的顺序
namenode:
datanode
secondarynamenode

心跳机制

集群节点之间必须做时间同步

  • namenode负责集群上任务的分工,如果要进行分工,则必须直到各个从节点的存活状况,namenode通过datanode定期向namenode发送的心跳报告得知的,datanode默认每隔3秒发送一次心跳报告

namenode什么时候才会判定datanode死了

  • datanode每隔3秒向namenode发送一次心跳报告,当namenode连续十次没有收到datanode的心跳报告,则认为datanode可能死了,这时namenode主动向datanode发送一个检查,发送一次检查的时间默认是5min,namenode 给自己两次机会,如果一次检查没有返回信息,这时namenode 会再次进行检查,如果两次检查都没有返回信息,则会判定当前的datanode已经死了,也就是说namenode最终判断datanode死了需要2 * 5min + 3s*10 = 630s

通过配置可以改变这个时间

安全模式

集群启动的时候namenode做了什么

  • 元数据
    1、抽象目录树
    2、数据和块的映射关系
    3、数据块存储的位置信息
  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值