hadoop的架构模型

最新推荐文章于 2021-11-29 20:35:33 发布

大黑哞

最新推荐文章于 2021-11-29 20:35:33 发布

阅读量188

点赞数

分类专栏：大数据

大数据专栏收录该内容

10 篇文章 0 订阅

订阅专栏

hadoop的架构模型

基本概念

元数据：描述数据的数据

元数据信息很重要，一定不能够丢失

文件系统：什么是文件系统？？？

第一个要求，能够存储数据
第二个要求，能够快速查找到我们需要的文件

1.x架构模型

hadoop分为两大块：

	hdfs：分布式文件存储系统

		namenode：主节点，接收处理客户端的请求，并且保存元数据信息

		datanode：从节点，主要职责就是存储数据

		secondaryNameNode：  辅助namenode管理元数据信息

	mapreduce：分布式的文件计算系统

		JobTracker：主节点，接收客户端提交的计算任务，并且分配任务

		TaskTracker：主要是用于执行任务的

在这里插入图片描述
文件系统核心模块：
NameNode：集群当中的主节点，主要用于管理集群当中的各种数据
secondaryNameNode：主要能用于hadoop当中元数据信息的辅助管理
DataNode：集群当中的从节点，主要用于存储集群当中的各种数据
数据计算核心模块：
JobTracker：接收用户的计算请求任务，并分配任务给从节点
TaskTracker：负责执行主节点JobTracker分配的任务

2.x的版本架构模型介绍

2.x架构：背下来

hadoop2.x主要分为两部分：

hdfs：分布式文件存储系统

	namenode：主节点，接收处理客户端的请求。保存元数据信息。

	datanode：从节点，存储数据

	secondaryNameNode： 辅助namenode管理元数据信息

yarn：资源调度管理系统

	resourceManager：主节点，接受客户端提交的任务，并且分配资源

	nodeManager：从节点，执行分配的任务

	资源：CPU,内存

如果是namenode高可用的话

secondaryNameNode：这个没有了

journalNode：在两个namenode之间同步元数据信息

zkfc：守护进程，主要是用于监察namenode的健康状况

第一种：NameNode与ResourceManager单节点架构模型
在这里插入图片描述
文件系统核心模块：
NameNode：集群当中的主节点，主要用于管理集群当中的各种元数据
secondaryNameNode：主要能用于hadoop当中元数据信息的辅助管理
DataNode：集群当中的从节点，主要用于存储集群当中的各种数据
数据计算核心模块：
ResourceManager：接收用户的计算请求任务，并负责集群的资源分配
NodeManager：负责执行主节点APPmaster分配的任务

第二种：NameNode单节点与ResourceManager高可用架构模型
在这里插入图片描述
文件系统核心模块：
NameNode：集群当中的主节点，主要用于管理集群当中的各种数据
secondaryNameNode：主要能用于hadoop当中元数据信息的辅助管理
DataNode：集群当中的从节点，主要用于存储集群当中的各种数据
数据计算核心模块：
ResourceManager：接收用户的计算请求任务，并负责集群的资源分配，以及计算任务的划分，通过zookeeper实现ResourceManager的高可用
NodeManager：负责执行主节点ResourceManager分配的任务

第三种：NameNode高可用与ResourceManager单节点架构模型
在这里插入图片描述
文件系统核心模块：
NameNode：集群当中的主节点，主要用于管理集群当中的各种数据，其中nameNode可以有两个，形成高可用状态
DataNode：集群当中的从节点，主要用于存储集群当中的各种数据
JournalNode：文件系统元数据信息管理
数据计算核心模块：
ResourceManager：接收用户的计算请求任务，并负责集群的资源分配，以及计算任务的划分
NodeManager：负责执行主节点ResourceManager分配的任务

第四种：NameNode与ResourceManager高可用架构模型
在这里插入图片描述
文件系统核心模块：
NameNode：集群当中的主节点，主要用于管理集群当中的各种数据，一般都是使用两个，实现HA高可用
JournalNode：元数据信息管理进程，一般都是奇数个
DataNode：从节点，用于数据的存储
数据计算核心模块：
ResourceManager：Yarn平台的主节点，主要用于接收各种任务，通过两个，构建成高可用
NodeManager：Yarn平台的从节点，主要用于处理ResourceManager分配的任务