作为 MapReduce 的继承者, Spark 主要有三个优点。
- 首先, Spark 非常好用。由于高级 API 剥离了对集群本身的关注,你可以专注于你所要做的计算本身, 只需在自己的笔记本电脑上就可以开发 Spark 应用。
- 其次, Spark 很快,支持交互式使用和复杂算法。
- 最后, Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等,而在 Spark 出现之前,我们一般需要学习各种各样的引擎来分别处理这些需求。 这三大优点也使得 Spark 可以作为学习大数据的一个很好的起点。
Ref
《Spark快速大数据分析》