【Spark快速大数据分析】一、Spark是什么

最新推荐文章于 2024-07-23 10:30:30 发布

搏一搏小单车变大摩托

最新推荐文章于 2024-07-23 10:30:30 发布

阅读量780

点赞数 14

分类专栏： Spark 大数据学习笔记文章标签： spark 数据分析大数据

本文链接：https://blog.csdn.net/qq_42189061/article/details/136694879

版权

3 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

本文介绍了Spark，一个基于Scala和JVM的集群计算平台，强调其高级API、内存优化、RDD、SQL支持、流处理、机器学习和图计算能力。Spark可在多种集群管理器上运行，提供高效灵活的扩展性。

摘要由CSDN通过智能技术生成

Spark是一个用来实现快速而通用 的集群计算的平台
Spark本身是由Scala写的，运行在JVM上的。
扩展了MapReduce
三个优点
- 好用：由于高级API剥离了对集群本身的关注，可以专注于计算本身。
- 很快：支持交互式查询和流处理等复杂算法
- 通用引擎：可完成各种运算（SQL/文本处理/机器学习…）
主要特点：能在内存中进行计算，因而更快
核心：对【由很多计算任务组成的、运行在多个工作机器或者是一个计算集群(Computer Cluster) 上的应用】进行调度
Spark软件栈