都是分布式计算框架,
Spark基于内存,MR基于磁盘(HDFS)。
Spark处理数据的能力一般是MR的十倍以上,
Spark中除了基于内存计算外,还有DAG有向无环图来切分任务的执行先后顺序。
MR中只有map,reduce和join,而Spark中有各种场景的算子
都是分布式计算框架,
Spark基于内存,MR基于磁盘(HDFS)。
Spark处理数据的能力一般是MR的十倍以上,
Spark中除了基于内存计算外,还有DAG有向无环图来切分任务的执行先后顺序。
MR中只有map,reduce和join,而Spark中有各种场景的算子