1:简介 利用服务器集群,根据用户自定义的业务逻辑,对海量数据进行分布式处理。 2:核心组建 A:hdfs(分布式文件系统) B:YARN(运算资源调度系统) C:MapReduce(分布式运算编程框架)