HDFS架构设计

目录

1.hosts文件

2.web页面解读

3.块block

4.HDFS架构设计

nn-->文件系统的命名空间(面试题):

dn

SNN


 

1.hosts文件

linux host文件的配置

window host文件的配置

 

hadoop:如果是vm/内网机器,直接配内网ip;

               如果是云主机,直接配外网ip。

tips:apache,hbase开发,hosts文件都要配置hbase集群的节点的ip hostname

2.web页面解读

browse directory能查看hdfs中所有的文件

运行案例,页面会显示作业名字,运行的人,类型,状态,内存,队列使用多少

 

3.块block

块的大小为128M,块的副本数为3(默认)

<property>
        <name>dfs.blocksize</name>
        <value>134217728</value>
</property>
<property>
        <name>dfs.replication</name>
        <value>3</value>
</property>

面试题:一个文件160m,块大小128m,副本数2。请问实际几个块,实际物理存储多少?

4个块,实际物理空间:160M*2=320M

 

4.HDFS架构设计

HDFS的进程:

  • NameNode nn  名称节点
  • secondary namenode snn  第二名称节点
  • datanode dn 数据节点

 

nn-->文件系统的命名空间面试题):

  1. 文件名称
  2. 文件目录结构
  3. 文件属性 创建时间 权限 副本数
  4. 文件对应哪些数据块  --> 数据块存储在哪些datanode上

 

作用:

管理文件系统的命名空间,维护文件系统树,以两种文件文件永久保存在磁盘上(持久化存储): 命名空间镜像文件 fsimage, 编辑日志 editlog

 

dn

存储:数据块 和数据块的校验和

与nn通信:

  • 每隔3秒发送一个心跳
  • 每10次心跳发送一次当前节点的blockreport

作用:读写文件的数据块

 

SNN

 

snn的文件记录

nn的日志记录

snn作用:定期合并fsimage+editlog文件为新的fsimage文件,推送nn个节点,简称为检查点 checkpoint

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值