一、Hadoop简洁
二、Hadoop特性
三、Hadoop版本演变
丰富的Hadoop生态系统
上面中组件以及对应的功能
一、Hadoop集群中节点类型以及作用
Hadoop框架两大核心设计:
(1)HDFS:读取数据I/O操作
(2)MapReduce:计算数据
两大类核心节点:
namenode:负责整个源数据存储的协调数据存储的功能
datanode:存储被拆分后的一块一块的数据
jobTracker:拆分大作业
TaskTracker:执行小作业
SecondaryNameNode:冷备份,一旦namenode出故障,SecondaryNameNode不会立刻顶上去。
二、集群硬件配置:各个节点分别使用什么样的机器配置
三、讨论:集群规模要多大?
四、集群的网络拓扑
五、集群的建立与安装