1. Hadoop 基础知识框架
老规矩灵魂三问,Hadoop是什么?用途在哪方面?如何使用?
分布式文件存储系统。Google的三篇论文 :
GFS -->HDFS、MapReduce -->MR、Big Table -->Hive。
主要用于集群节点上 管理保存文件; 安装搭建、命令的上传下载 不说明了,直接上干货! 架构体系。 现在回过头来看,感觉像是顿悟了.
做到不看图 也能说出来 框架图–各组件间的工作原理
.
脑海中要有三个名词 的组成架构! Client、NameNode(Metadata)、DataaNode、SecondaryNameNode
Hadoop API 使用介绍 链接: link. 这篇写的比较详细,如何使用有介绍.
HDFS中数据流 读写过程
NameNode与SecondaryNameNode 工作机制
5个关键字:NameNode、SecondaryNameNode、edits、fsimage、checpoint、
DataNode工作机制
2.x版本 HA架构图
关键字:NN、DN、JournalNode、ZKFC、zookeeper
2.x版本 Yarn架构
关键字:Clinet、ResoureManager:Scheduler、ApplicationsManager;
NodeManager、Container、Tasker
有了以上知识框架的基础,我们就可以进行第二篇提高版的总结.