Hadoop
Created Wednesday 14 March 2018
HDFS:分布式文件系统
Yarn:作业调度和集群资源管理框架
MapReduce:分布式运算编程框架
狭义Hadoop定义:HDFS,YARN,MAPREDUCE
广义Hadoop定义:一个hadoop生态圈
hadoop版本:
社区版,商业版(cloudera的CDH)
hadoop集群搭建:
hadoop集群包含两个集群,HDFS集群和YARN集群,两者逻辑上分离,但
物理上常在一起。
HDFS角色:
NameNode,DataNode,SecondaryNameNode(想当于NameNode的秘书)
YARN角色:
ResourceManager和NodeManager
Hadoop部署模式分为三种:
Stabdalone mode(独立模式)
Pseudo-Distributed(伪分布式模式)
Cluster mode(集群模式)
Pseudo-Distributed(伪分布式模式)
Cluster mode(集群模式)