Hadoop基础组件

Hadoop是一个开源框架,主要由MapReduce计算模型和HDFS存储系统组成。MapReduce将任务分为Map和Reduce两个阶段,YARN作为资源管理器,包含ResourceManager、NodeManager和ApplicationMaster。ResourceManager处理客户端请求并监控NodeManager,NodeManager管理单节点资源,ApplicationMaster负责任务的管理和资源申请。HDFS中,NameNode存储文件元数据,DataNode保存实际数据,SecondaryNameNode定期备份NameNode的元数据。
摘要由CSDN通过智能技术生成

Hadoop

MapReduce 计算

MapReduce 把任务分为两阶段,即Map 阶段 和 Reduce 阶段

Yarn 资源调度
  • Resource Manger(RM 整个YARN集群的管理)

    1. 处理客户端请求
    2. 监控NodeManager
    3. 启动或监控ApplicationMaster
  • NodeManager(NM 单台节点的关联)

    1. 管理单个节点上的资源
    2. 处理来自ResourceManager的命令
    3. 处理来自ApplicationMaster的命令
  • ApplicationMaster(AM 每个任务的管理)临时角色

    1. 负责数据的切分(分块)
    2. 为应用程序申请资源并分配内部任务
    3. 任务的监控和容错
  • Container 临时角色

    Container 是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存,CPU,磁盘,网络等,Yarn的任务运行在Container 中

HDFS 数据存储
  • NameNode(nn)

    存储文件的元数据(如文件名,文件目录结构,文件属性,块列表和DataNode等)

  • DataNode(dn)

    在本地文件系统存储文件块数据,以及块数的校验和

  • Secondary NameNode(2nn)

    每隔一段时间对NameNode元数据备份

Common 辅助工具
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值