Hadoop历史版本架构分析

最新推荐文章于 2022-07-31 12:13:38 发布

xiaoxu_xiaoyou

最新推荐文章于 2022-07-31 12:13:38 发布

阅读量181

点赞数

分类专栏：大数据学习文章标签：大数据Hadoop架构

本文链接：https://blog.csdn.net/xiaoxu_xiaoyou/article/details/100019826

版权

5 篇文章 0 订阅

订阅专栏

hadoop三大核心

在这里插入图片描述

文件系统核心模块
- NameNode
  
  集群当中的主节点，主要用于管理集群当中的各种数据
- secondaryNameNode
  
  主要能用于hadoop当中元数据信息的辅助管理
- DataNode
  集群当中的从节点，主要用于存储集群当中的各种数据
数据计算核心模块
- ResourceManager
  
  接收用户的计算请求任务，并负责集群的资源分配，当有任务接收时，ResourceManger会另外启动AppMaster服务对计算任务进行分配（计算任务分配和资源分配），再由ResourceManager管理各个NodeManager资源分配进行各自的计算任务
- NodeManager：负责执行主节点APPmaster分配的任务

在这里插入图片描述

文件系统核心模块：
- NameNode
  
  集群当中的主节点，主要用于管理集群当中的各种数据，其中nameNode可以有两个，形成高可用状态
- DataNode
  
  集群当中的从节点，主要用于存储集群当中的各种数据
- JournalNode
  
  文件系统元数据信息管理，保证主从的NameNode的数据一致
数据计算核心模块：
- ResourceManager
  
  接收用户的计算请求任务，并负责集群的资源分配，以及计算任务的划分
- NodeManager
  
  负责执行主节点ResourceManager分配的任务
2.4、NameNode与ResourceManager高可用架构模型
- 文件系统核心模块：
- NameNode
  
  集群当中的主节点，主要用于管理集群当中的各种数据，一般都是使用两个，实现HA高可用
- JournalNode
  
  元数据信息管理进程，一般都是奇数个
- DataNode
  
  从节点，用于数据的存储
数据计算核心模块：
- ResourceManager
  
  Yarn平台的主节点，主要用于接收各种任务，通过两个，构建成高可用
- NodeManager
  
  Yarn平台的从节点，主要用于处理ResourceManager分配的任务

关注