Spark特点: 大数据分布式计算框架,内存计算 分布式计算 内存计算 中间结果在内存 迭代 容错性 多计算范式 四大核心扩展功能: Spark SQL:Sql on hadoop系统,提供交互式查询、能够利用传统的可视化工具 在Spark上进行类似SQL的查询操作,报表查询等功能 GraphX:图计算引擎,大规模图运算,pagerank MLlib:聚类分类 分类 推荐 等机器学习算法 *Application(应用程