DataNode工作机制

1.DataNode启动后会向NameNode注册。(将自己所保存的Block信息告诉NameNode)

2.NameNode接收到DataNode发送的信息,注册成功

3.在默认配置中,DataNode会周期性(6小时)上报所有块信息

4.DataNode会每三秒心跳一次,目的是告诉NameNode,它还活着

5.当NameNode超过十分钟+30秒没有收到DataNode的心跳,则认为该节点不可用,那么后续NameNode不会再向该节点进行读写操作

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Datanode分块机制是指在Hadoop分布式文件系统中,为了支持大文件的存储和处理,将大文件划分为多个块(Block),每个块的大小通常为64MB或128MB,并将这些块分散存储在不同的Datanode上。 具体来说,当客户端上传一个大文件时,Namenode会根据预设的块大小将文件划分为多个块,并为每个块分配一个唯一的Block ID。然后,Namenode会将每个块的Block ID和副本信息(如副本数、存储位置等)存储在元数据(Metadata)中。 接下来,客户端会通过数据流的方式将每个块上传到对应的Datanode上,并告知Datanode所上传的块的Block ID和副本信息。Datanode会确认该块是否已经存在于本地,如果不存在,则会将该块存储在本地,并根据副本数的设置将该块复制到其他的Datanode上。如果该块已经存在于本地,则Datanode会返回成功的响应。 当客户端需要读取某个块时,它会向Namenode请求该块的副本信息。Namenode会查询元数据,返回该块所有副本的位置信息。客户端会选择距离最近的Datanode读取该块,如果该Datanode发生故障,则会选择距离次近的Datanode读取该块,以此类推,直到成功读取该块为止。 总的来说,Datanode分块机制Hadoop分布式文件系统的核心机制之一,它通过将大文件划分为多个块,并将这些块分散存储在不同的Datanode上,实现了高效的数据存储和处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值