hadoop包括如下几个模块: hadoop common:公用的工具,支持其他的hadoop模块hadoop distribute file system(hdfs):分布式文件系统,提供了一个高吞吐量hadoop yarn:作业调度和集群资源管理的框架,比如集群中还有多少资源(内存、cpu)可以用。例如作业提交上去时,需要10G内存,但是当前只有5G的容量,这时这个作业就无法提交。hadoop mapreduce:基于yarn的并行处理大数据的系统