hadoop版本
Apache
Cloudera
Hortonworks
MapR
intel
hadoop2
通用 hdfs yarn MapReduce
hadoop1
hdfs mapreduce
hadoop2
hdfs2 yarn(资源管理平台)
hdfs2 负责数据的分布式存储
主节点 有2个 namendoe
从节点 多个 datanode
nameode
接受用户请求,用户操作入口
维护文件系统的目录结构,命名空间
datanode 存储文件
yarn
资源的调度和管理 cpu,内存,网络..
主节点 有2个 ResourceManger
从节点 多个 NodeManager
ResourceManger
集群资源的分配和调度
MapReduce,Storm,Spark等应用必须实现ApplicationMaster接口,才能被RM管理
NodeManager
单节点资源管理
MapReduce
依赖磁盘io的批处理计算模型
主节点,一个 jobTracker
从节点 多个 TaskTracker
JobTracker
接受客户提交的计算任务
把计算任务分个TaskTrackers ,任务调度
监控TaskTracker的执行情况
TaskTracker
执行JobTarcker分配的计算任务