Hadoop集群配置与HDFS介绍

HDFS 文件系统的容量

理解:将多个节点的容量汇总成一个大的文件系统,在一个节点上传数据,在其的节点上都能够访问使用
在这里插入图片描述

Hadoop的组成

HDFS(海量数据存储系统),MapReduce(海量数据的计算系统计算框架),Yarn(集群资源管理框架)

HDFS的管理者:NameNode
作用:
1、维护 管理文件系统的名字空间(元数据信息)
2、负责确定指定的文件块到具体的Datanode结点的映射关系。
3、维护管理 DataNode上报的心跳信息
在这里插入图片描述
HDFS的辅助管理者:SecondaryNameNode
作用:负责NameNode管理工作
在这里插入图片描述
HDFS的工作者:DataNode
作用:
1、执行数据的读写(响应的是客户端)
2、周期性向NameNode做汇报(数据块的信息、校验和)
若datanode 10分钟没有向NameNode做汇报,表示已丢失(已宕机)
心跳周期 3秒 3、执行流水线的复制(一点一点复制)
在这里插入图片描述
MapReduce

Yarn 的管理者:ResourceManager
Yarn 的工作者:NodeManager

HDFS 副本存放机制

第一份数据来源于客户端
第二份存放的位置是与第一个副本在相同机架上,且不在同一个节点,按照一定的规则(cpu 内存 IO是用率,和硬
盘剩余容量)找到一个节点存放
第三个副本的存放位置是与第一第二份数据副本不在同一个机架上,且逻辑与存放副本1和2的机架距离最近的机上
按照一定的规则(cpu 内存 IO是用率,和硬盘剩余容量)找到一个节点进行存放
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值