1.分布式和集群介绍
-
分布式: 多台机器做不同的事情, 然后组成1个整体.
-
集群: 多台机器做相同的事情.
多台机器既可以组成 中心化模式(主从模式), 也可以组成 去中心化模式(主备模式)
可以参考下面这张例图,更加简单明了。
2.Hadoop框架国内外应用
-
国外
-
Yahoo雅虎, 节点4.2W+, 超10W核, 总存储350PB+, 每月提交作业 1000W+
-
-
国内
-
阿里巴巴, 节点3000+, 超4W核心, 内存超100TB, 每月提交作业 450W+
-
-
Hadoop的组成
-
HDFS: 分布式存储框架
-
MapReduce: 分布式计算框架
-
Yarn: 任务接收和调度器
-
3. Hadoop的架构图(重点)看懂这三张图就完全懂了
-
Hadoop1.X = HDFS + MapReduce
-
Hadoop2.X, 3.X = HDFS + MapReduce + Yarn
-
Hadoop集群高可用模式图解
4.Hadoop集群环境初体验
-
搭建方式
-
方式1: Standalone mode 单机模式(几乎没人这么干)
把所有的服务(namenode, SecondaryNameNode, datanode, ResourceManager, nodemanager)装到1台机器, 适用于: 学习, 调试.
-
方式2: Cluster mode 集群模式
node1: namenode, datanode, ResourceManager, nodemanager
node2: SecondaryNameNode, datanode, nodemanager
node3: datanode nodemanager
-