大数据笔记之HDFS架构

HDFS架构

节点分为两类:一类叫“主节点”(Master Node)或者也被称为“名称结点”(NameNode),另一类叫“从节点”(Slave Node)或者也被称为“数据节点”(DataNode)

  1. NameNode(NN):负责管理集权的命名空间,并且为所有文件和目录维护一个树状结构的元数据信息。元数据持久化存储在硬盘中。保存文件,block ,datanode之间的映射关系。全权管理数据块的复制,它周期性地从集群中的每个Datanode接收心跳信号和块状态报告(Blockreport)。
  2. FsImage(文件系统镜像文件),EditsLog(编辑日志文件):二者都存储在NN中,文件系统镜像文件存储所有命名空间的信息,编辑日志文件存储所有事务记录。二者是HDFS的核心数据结构。
  3. SecondaryNameNode(SNN):不是真正意义上的NN,主要负责周期性地把FsImage和EditsLog合并,然后清楚旧的日志文件。
  4. Block(块):HDFS的文件划分为多个64MB的大块作为独立存储单元,每个块有多个副本存储在不同的机器上,副本数可在文件生成时指定。
  5. DataNode(DN):存储文件块内容,文件内容保存在磁盘中,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。DN维护block id到DN的映射关系。

•保存Block
           •启动DN线程的时候会向NN汇报block信息
           •通过向NN发送心跳保持与其联系(3秒一次),如果NN 10分钟没有收到DN的心跳,则认为其已经lost,并copy其上的block到其它DN。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值