Spark是基于内存处理大规模数据的通用快速计算引擎
特征:
1) 快速:速度远超Hadoop计算速度
2) 易使用:提供Java,Python,Scala,SQL等API
3) 通用性:支持交互式查询,流处理,批处理,机器学习算法和图形处理
4) 到处运行:Standalone, Hadoop,Cassandra等数据工具配合使用
Spark Core
1) 实现基本功能,任务调度,内存管理,错误恢复,与存储系统交互
Spark是基于内存处理大规模数据的通用快速计算引擎
特征:
1) 快速:速度远超Hadoop计算速度
2) 易使用:提供Java,Python,Scala,SQL等API
3) 通用性:支持交互式查询,流处理,批处理,机器学习算法和图形处理
4) 到处运行:Standalone, Hadoop,Cassandra等数据工具配合使用
Spark Core
1) 实现基本功能,任务调度,内存管理,错误恢复,与存储系统交互