深入剖析HDFS架构设计

本文详细探讨了HDFS的架构设计,包括HDFS的三个核心进程:NameNode、DataNode和SecondaryNameNode。分析了block的大小和副本数,重点阐述了NameNode的功能,如目录结构、fsimage和edits log的管理,以及DataNode的角色,它如何存储数据块并定期向NameNode报告。同时,还介绍了SecondaryNameNode的作用和HDFS的权限系统。
摘要由CSDN通过智能技术生成

HDFS架构设计

1、HDFS的三个进程

       NameNode:接受客户端请求、管理hdfs、维护文件元信息和操作日志

       DataNode:存储数据块和数据块校验和、通过水平复制使文件冗余度满足要求

       SecondaryNameNode:对文件元信息(fsimage文件)和操作日志(edits文件)进行合并

2、block大小和副本数 

​
 
blocksize:      
        hadoop 1.x  blocksize=64MB
        hadoop 2.x  blocksize=128MB
        
        属性:hdfs-site.xml中的dfs.blocksize
副本数:
        hadoop 1.x  3
        hadoop 2.x  3
        hadoop 3.x  1.5

        属性:hdfs-site.xml中的dfs.replication


     

​

3、NameNode详解

    A、目录结构

B、dfs.namenode.name.dir属性

所属配置文件:
    hdfs-site.xml

解释:
    该属性确定存放元数据的目录,存放元数据的目录下有fsimage、edits log、VERSION、in_use.lock等诸多文件或目录。
    该属性可以指定多个路径,以逗号分隔。一旦一个路径对应的磁盘故障,多个路径可保证HDFS仍能找到文件的元数据,从而避免系统故障。

C、NameNode 

NameNode:存储文件的命名空间,比如

    a.文件对应哪些block,这些block位于哪些节点上

    b.文件名称、文件属性、目录结构等

   
    a存储在内存中,由DataNode在向NameNode注册时发生,或通过心跳机制周期性发送
    b持久化在fsimage文件中

  D、fsimag

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二百四十九先森

你的打赏是我努力的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值