-
spark是基于
内存计算
,会将中间结过存放在内存,方便后续计算的使用。MR会将中间结果存储在磁盘上。-
内存数据的读写速度要比磁盘快的多,所以spark的计算速度要比MR快
-
Presto也是基于内存计算的,Presto不适合海量数据处理,而且不能创建库表。Spark对海量数据在内存上的计算做了优化,内存不足是会将结果存在磁盘上,适合海量数据处理,并且可以进行库表创建
-
-
Spark的
计算任务是由线程
完成的。MR的计算任务是由进程完成的-
线程切换计算任务的速度比进程切换计算任务速度快
-
Spark和MapReduce的区别
于 2023-02-17 09:18:42 首次发布
Spark通过内存计算提供更快的速度,支持海量数据处理并允许创建库表,当内存不足时数据会转存到磁盘。相比之下,MR的中间结果存储在磁盘,计算任务由进程完成,速度相对较慢。Presto虽也基于内存计算,但不适合大规模数据处理且不支持库表创建。
摘要由CSDN通过智能技术生成