HDFS架构-元数据分析

本文详细介绍了HDFS的主从架构,重点解析了NameNode和DataNode的角色及其功能。NameNode作为主节点,管理HDFS的元数据,包括文件系统命名空间、文件属性和文件块位置等,而DataNode则是数据存储节点,保存文件块及元数据。文章还提到了SecondaryNameNode的作用,用于定期合并fsimage和editlog,确保元数据的持久性和系统效率。此外,讨论了心跳机制和负载均衡对于HDFS的重要性。
摘要由CSDN通过智能技术生成

五.HDFS架构

       

 

  • 大多数分布式大数据框架都是主从架构

  • HDFS也是主从架构Master|Slave或称为管理节点|工作节点

    • 主叫NameNode,中文称“名称节点”

    • 从叫DataNode,中文称“数据节点”

5.1 NameNode

5.1.1 文件系统

  • file system文件系统:操作系统中负责管理文件、存储文件信息的软件

    • 具体地说,它负责为用户创建文件,存入、读取、修改、转储、删除文件等

  • 读文件 =>>找到文件 =>> 在哪 + 叫啥?

  • 元数据

    • 关于文件或目录的描述信息,如文件所在路径、文件名称、文件类型等等,这些信息称为文件的元数据metadata

    • 注意:元数据的概念在其他的大数据框架中也屡有提及

  • 命名空间

    • 文件系统中,为了便于管理存储介质上的内容,给每个目录、目录中的文件、子目录都起了名字,这样形成的层级结构,称之为命名空间

    • 同一个目录中,不能有同名的文件或目录

    • 用处:这样通过目录+文件名称的方式能够唯一的定位一个文件

 

5.1.2 HDFS-NameNode

  • HDFS本质上也是文件系统filesystem,所以它也有元数据metadata;

  • HDFS元数据metadata保存在NameNode内存

  • NameNode作用

    • HDFS的主节点

    • 负责管理文件系统的命名空间,将HDFS的元数据存储在NameNode节点的内存中

    • 负责响应客户端对文件的读写请求

  • HDFS元数据

    • 文件目录树、所有的文件(目录)名称、文件属性(生成时间、副本、权限)、每个文件的块列表、每个block块所在的datanode列表

 

  • 每个文件、目录、block占用大概150Byte字节的元数据;所以HDFS适合存储大文件,不适合存储小文件

  • HDFS元数据信息以两种形式保存:①编辑日志

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值