hadoop2基本概念

hadoop版本
 
 Apache
 Cloudera
 Hortonworks
 MapR
 intel
 
hadoop2
通用 hdfs yarn MapReduce


hadoop1
hdfs mapreduce

hadoop2
hdfs2 yarn(资源管理平台)

hdfs2 负责数据的分布式存储
主节点 有2个 namendoe
从节点 多个 datanode

nameode
接受用户请求,用户操作入口
维护文件系统的目录结构,命名空间

datanode  存储文件

yarn
资源的调度和管理  cpu,内存,网络..

主节点 有2个 ResourceManger
从节点 多个 NodeManager

ResourceManger
集群资源的分配和调度
MapReduce,Storm,Spark等应用必须实现ApplicationMaster接口,才能被RM管理

NodeManager
单节点资源管理


MapReduce
依赖磁盘io的批处理计算模型

主节点,一个 jobTracker
从节点  多个 TaskTracker

JobTracker
接受客户提交的计算任务
把计算任务分个TaskTrackers ,任务调度
监控TaskTracker的执行情况

TaskTracker
 执行JobTarcker分配的计算任务
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值