什么情况下Spark 比 MR 程 序快 ? 在 有shuffle 的情况下 (中间结构或都要落本地磁盘因为又安全又可以存储大量的中心结果) 比如 WordCount MR 在有shuffle 的情况下要先进行排序 ,(把 K 作为输出) Spark 要进行选择性排序