Spark是一个大数据领域的统一分析引擎。
特征:
- 速度快
- 易于使用
- 概括性(整合了SQL、streaming和复杂分析)
- Runs Everywhere(比如可以运行在Hadoop中)
框架模块:
- Spark SQL(SQL处理)
- Spark Streaming(流式处理)
- MLlib(机器学习)
- GraphX(图计算)
运行模式(可以在多种环境中运行):
- 本地模式(单机)
- Spark Standalone(Spark自己的集群)
- Hadoop YARN
- Kubernetes
Spark是一个大数据领域的统一分析引擎。
特征:
框架模块:
运行模式(可以在多种环境中运行):