启动hadoop集群命令_Hadoop完全分布式—集群配置+单点启动

在准备好3台虚拟机,并安装好jdk和hadoop后,我们开始进行集群配置,首先要做一个集群配置的规划,也就是将不同的角色放到不同的虚拟机上。hadoop的三个核心部分Hdfs 数据存储Yarn 资源调度MapReduce 计算框架这里我们要规划分配的是Hdfs和Yarn的角色。Hdfs的结构1.NameNode (数据的索引) 主角色 名字节点 统筹信息,统筹数据存储的工作,本身不存储数...
摘要由CSDN通过智能技术生成

35ad3e9d95527ebab724bb59bded7047.png

在准备好3台虚拟机,并安装好jdk和hadoop后,我们开始进行集群配置,首先要做一个集群配置的规划,也就是将不同的角色放到不同的虚拟机上。

hadoop的三个核心部分

  • Hdfs 数据存储
  • Yarn 资源调度
  • MapReduce 计算框架

这里我们要规划分配的是Hdfs和Yarn的角色。

Hdfs的结构

35986bf138ac2d02fdad5f0094ac9d0b.png

1.NameNode (数据的索引) 主角色 名字节点 统筹信息,统筹数据存储的工作,本身不存储数据

2.DataNode (数据的本身) 数据节点 以块为单位存储数据(Block),默认128M一个块

3.Secondary NameNode(2NN)用来监控HDFS状态的辅助后台程序(辅助NameNode)

3台虚拟机中我们要选一台存放NameNode,另一台放2NN,并且每一台虚拟机都存放一个DataNode。

Yarn的结构

88aeb6806df2da1c6483d0f91c7ae8a3.png

1.Resource Manager:负责统筹管理集群的计算资源,响应资源请求,协调NodeManager。

2.Node Manager:负责管理物理机器上与容器的协调。

3.Application Master :做应用内的资源协调和申请。

4.container:对任务运行环境的抽象,封装了CPU、内存等多维资源及环境变量、启动命令等任务运行相关信息。

3台虚拟机中选择一台存放Resource Manager,每台虚拟机存放一个Node Manager。


集群部署规划

生产环境中,一般NN、RN、2NN是不会和DN、NM混搭的,但是对于个人PC端来说,16G内存无法支撑6台虚拟机,因此采取3台虚拟机混搭的模式。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值