第126讲:Hadoop集群管理之Datanode目录元数据结构详解学习笔记

本文详细介绍了Hadoop集群中Datanode的目录元数据结构,包括datanode在节点上的位置、VERSION文件内容、storageID的作用以及block和meta文件的详细解释。此外,还探讨了Hadoop如何通过创建子目录来管理和组织数据块,以优化block管理。
摘要由CSDN通过智能技术生成

126讲:Hadoop集群管理之Datanode目录元数据结构详解学习笔记

namenode是管理hdfs文件系统的元数据

datanode是负责当前节点上的数据的管理,具体目录内容是在初始阶段自动创建的。在用hdfs dfs namenode format时并没有对datanode进行format

datanode中目录是按文件信息存储的。

datanode存在于具体节点上的hadoop-2.6.0/dfs/data/current中。

datanodeVERSION内容与namenodeVERSION内容相似。

storageID:在namenodedatanode沟通时,datanode会从namenode获得storageID。对于具体datanode来说,storageID是唯一的。

datanode访问namenode时需要这个ID

namenode可以用这个属性区分不同的datanode

其他内容:clusterID/cTime/storageType

从数据存储角度看datanode中有很多以block开头的文件,这些文件有两种:

1.hdfs本身的块文件,具体的原始数据。

2.块的元数据,以meta为后缀。

块文件包含所存储文件的原始文件,元数据包含头部和当前块的区段,校验等信息。

hadoop在设置datanode的目录结构时,会创建子目录来存放文件的数据块及元数据信息。如果当前目录中存放了64个数据块(可设置:dfs.datanode.number.blocks)就创建子目录。

一次进行一个树状的拓扑结构。这样就使用datanode容易管理各个目录的文件,避免了很多block<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值