HDFS中DataNode工作机制

1.DataNode工作机制

1)一个数据块在datanode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据(包括数据块的长度,块数据的校验和,以及时间戳)。

2)DataNode启动后向namenode注册,通过后,周期性(1小时)的向namenode上报所有的块信息

3)心跳是每3秒一次心跳返回结果带有namenode给该datanode的命令如复制块数据到另一台机器,或删除某个数据块。如果超过10分钟没有收到某个datanode的心跳,则认为该节点不可用

4)集群运行中可以安全加入和退出一些机器。

2.数据完整性

1)当DataNode读取block的时候,它会计算checksum

2)如果计算后的checksum,与block创建时值不一样,说明block已经损坏。

3)client读取其他DataNode上的block.

4)datanode在其文件创建后周期验证checksum

3.DataNode掉线时限参数设置

datanode进程死亡或者网络故障造成datanode无法与namenode通信,namenode不会立即把该节点判定为死亡,要经过一段时间,这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间为timeout,则超时时长的计算公式为:

timeout  = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval

而默认的dfs.namenode.heartbeat.recheck-interval 大小为5分钟,dfs.heartbeat.interval默认为3秒。

需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒dfs.heartbeat.interval的单位为秒

<property>
    <name>dfs.namenode.heartbeat.recheck-interval</name>
    <value>300000</value>
</property>
<property>
    <name> dfs.heartbeat.interval </name>
    <value>3</value>
</property>

 

1

)当DataNode读取block的时候,它会计算checksum

2)如果计算后的checksum,与block创建时值不一样,说明block已经损坏。

3client读取其他DataNode上的block.

4datanode在其文件创建后周期验证checksum

 

转载于:https://www.cnblogs.com/MWCloud/p/11237222.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HDFS(分布式文件系统)Datanode高密度存储机型的探索尝试是为了提高存储效率和降低成本。在传统的数据存储,每个服务器都有自己的本地硬盘,这导致了大量的硬盘空间浪费和不必要的成本。在高密度存储机型,多个Datanode可以共享共同的存储设备。 高密度存储机型使用了更大容量的硬盘,充分利用了硬盘的存储空间,使得每个服务器可以存储更多的数据。而且通过合理的数据管理和存储策略,可以实现数据的高效存储和读取。例如,采用副本机制和数据块切分技术,将数据分布在多个Datanode上,可以提高数据的安全性和容灾性,并且可以并行读取数据,提高数据的读取速度。 高密度存储机型还可以减少服务器的数量和维护成本。相比于传统的存储方式,高密度存储机型可以在较少的服务器上存储更多的数据,减少了机房空间的占用和耗电量的消耗。同时,减少了服务器的数量,降低了维护和运维的成本。 然而,高密度存储机型也存在一些挑战和限制。首先,硬盘密度的提高可能会导致硬盘故障的风险增加,需要采取相应的容错和备份措施。其次,高密度存储机型对服务器的处理能力和带宽要求较高,需要具备足够的计算资源和网络条件。另外,由于高密度存储机型的存储空间巨大,数据的管理和维护也变得更加复杂和困难。 总的来说,HDFS Datanode高密度存储机型的探索尝试是为了提高存储效率和成本效益。通过充分利用硬盘存储空间,减少服务器数量和维护成本,可以更好地满足大规模数据存储和处理的需求。然而,在应用还需综合考虑硬盘故障、计算资源和数据管理等方面的问题,以实现高效稳定的存储环境。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值