Hadoop
定义:Hadoop是一个分布式系统基础架构。
主要解决:海量数据的存储和海量数据的分析计算问题。
优势:(4高)
1)高可靠性:Hadoop底层维护多个数据。
2)高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。
3)高效性:并行工作的。
4)高容错性:能够自动将失败的任务重新分配。
Hadoop1.x和Hadoop2.x区别
HDFS架构概述
1)NameNode:存储文件的元数据,如文件名,文件目录,文件属性,以及每个文件的块列表和块所在的DataNode等。(绝世武功的目录)
2)DataNode:在本地文件系统存储文件块数据,以及块数据的校验和。(绝世武功)
3)Secondary NameNode:监控HDFS状态的辅助后台程序。