不严谨的说:mr每次计算中间结果需要落盘,spark计算结果存储于内存
其实mr、spark都使用到了内存计算、并且都落盘过
spark通过DAG对mr进行了一些优化,使得减少了与磁盘的交互,相比于mr有了更优解
但是mr每次落盘虽然慢了一些但是相对于spark更为稳定,当数据量很大的时候spark加载数据到内存可能导致OOM,因此mr适合计算较长周期的任务指标
不严谨的说:mr每次计算中间结果需要落盘,spark计算结果存储于内存
其实mr、spark都使用到了内存计算、并且都落盘过
spark通过DAG对mr进行了一些优化,使得减少了与磁盘的交互,相比于mr有了更优解
但是mr每次落盘虽然慢了一些但是相对于spark更为稳定,当数据量很大的时候spark加载数据到内存可能导致OOM,因此mr适合计算较长周期的任务指标