HADOOP 2.0的MapReduce只作为计算框架,不作为资源调度,资源调度由yarn完成,同时HA作NameNode的热备份。
spark基于内存计算而MapReduce基于磁盘操作
FLUME进行日志收集
SQOOP进行数据导入
Cloudera(CDH)
HADOOP 2.0的MapReduce只作为计算框架,不作为资源调度,资源调度由yarn完成,同时HA作NameNode的热备份。
spark基于内存计算而MapReduce基于磁盘操作
FLUME进行日志收集
SQOOP进行数据导入
Cloudera(CDH)