个人总结了三点,如下: 数据处理形式不同:Spark的数据转换都是基于内存的,而MR都是处理一次刷到磁盘一次代码书写的不同:Spark提供了非常丰富的算子,书写起来非常爽,而MR的书写就有点让人头痛容错性不同:Spark的容错比MR更加高,因为Spark算子有血缘关系