一、Hadoop概述
1、Hadoop是一个可靠的、可扩展的、分布式系统基础架构。
2、创始人:Doug Cutting 和Mike
二、Hadoop的版本
1、Hadoop1.0:HDFS和MapReduce
2、Hadoop2.0:完全重构的一套系统,不兼容1.0。包含了HDFS、MapReduce和Yarn
3、Hadoop3.0:包含了HDFS、MapReduce、Yarn以及Ozone
三、Hadoop的模块
1、Hadoop Common:基本模块
2、Hadoop Distributed File System:HDFS。进行数据的分布式存储
3、Hadoop YARN:进行任务调度和节点资源管理
4、Hadoop MapReduce:基于Yarn对海量数据进行并行处理
5、Hadoop Ozone:基于HDFS进行对象的存储