- 博客(1)
- 收藏
- 关注
转载 Spark:一个高效的分布式计算系统
概述 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习
2015-09-17 15:05:19 3138
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人