mr目前不支持DAG计算模型,Tez尝试做这样的优化,但还不成熟。
spark 1.2.0之前的版本,shuffle有问题,不够稳定,1.2.0使用了netty4,据称解决了问题,还没有进行尝试。
spark生态圈更具优势,spark sql、spark streaming、spark graphx、spark mllib都基于spark core,之间可以无缝串联。
spark更方便,spark-shell可以很快地进行一些原型验算。
hadoop更heavy也更稳定。
转载于:https://my.oschina.net/u/1426212/blog/370506