《Hadoop从入门到放弃》
1)hadoop是Apache基金会开发的分布式系统基础架构
2)主要解决海量数据的存储和海量数据的分析计算问题
主要做两个工作:1.存储 2.分析计算
优势:
1)高可靠行
2)高扩展性
3)高效性
4)高容错性
Hadoop的组成
HDFS架构概述
HDFS(Hadoop Distributed File System)
1)NameNode(NM)
2)DateNode(NN)
3)Secondary NameNode(2NM)
YARN架构概述
1)ResourceManager(RM)
处理客户端请求
监控NodeManager
启动或监控ApplicationMaster
资源分配与调度
2)NodeManager(NM)
3) ApplicationMaster(AM)
4) Container