1.HDFS 一个高可靠、高吞吐量的分布式文件系统,对海量数据的存储 2.MapReduce 一个分布式的资源调度和离线并行计算框架 3.Yarn 基于HDFS,用于作业调度和集群资源管理的框架 4.Common Hadoop工具包,支持其他模块的工具模块(Configuration、PRC、序列化机制、日志操作)