Spark 介绍

最新推荐文章于 2021-03-14 19:20:01 发布

数据源的港湾

最新推荐文章于 2021-03-14 19:20:01 发布

阅读量1k

点赞数 1

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Post_Yuan/article/details/52328901

版权

大数据专栏收录该内容

84 篇文章 5 订阅

订阅专栏

Spark 是什么？

Spark是UC Berkeley开源的类Haddop Map-reduce的通用并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有map reduce的优点；同时Spark可Job的中间输出和结果可以保存在内存中，从而不再需要读写hdfs，因此Spark能更好的适用于数据挖掘与机器学习等需要迭代的map reduce算法。

Spark 与 Map-Reduce

Map-Reduce通常将中间结果放在HDFS上，Spark是基于内存并行计算的框架，中间结果可以存放于内存中，对于迭代计算效率比较高。

Map-Reduce会消耗大量时间在排序上面，但有些时候并不需要排序，Spark可以避免不必要的排序造成的消耗。

Spark是一个有向无环图，并对其优化。

Spark支持的API

Java, Scala, Python等

Spark运行模式

Local

Standlone

Spark on Yarn

Spark on Mesos

RDD是什么？

RDD，全称Resilient Distributed Dataset，中文名为弹性分布式数据集。RDD是一个只读、分区记录的集合，可以看成是存储数据的一种数据结构。在Spark是一切基于RDD。RDD的具体内容后续会有专门文章详解，此处不作过多说明。

数据源的港湾

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Spark 介绍

Spark 是什么？ Spark是UC Berkeley开源的类Haddop Map-reduce的通用并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有map reduce的优点；同时Spark可Job的中间输出和结果可以保存在内存中，从而不再需要读写hdfs，因此Spark能更好的适用于数据挖掘与机器学习等需要迭代的map reduce算法。
复制链接

扫一扫

专栏目录

数据源的港湾 CSDN认证博客专家 CSDN认证企业博客

码龄8年

504: 原创

13万+: 周排名

15万+: 总排名

136万+: 访问

: 等级

1万+: 积分

245: 粉丝

621: 获赞

128: 评论

759: 收藏

私信

关注

热门文章

分类专栏

最新评论

分布式一致性问题之混合逻辑时钟
nn_wai: 你这个第二版算法的if条件判断根本不对，else if pt.j <= l.j and l.m <= l.j then c.j = c.j + 1，如果pt.j < l.j && l.m==l.j呢，这时候要比较c.j 和c.m，原论文的判断条件避免了这种边界的case情况，文中的三个case无非就是想判断哪个的物理时钟是最大的，但是忽略了两两相等的边界case
TDH（Transwarp Data Hub）社区版安装教程
星环科技TDH社区版: 前段时间TDH社区版重新重磅推出，同时还推出了单机即可30秒一键启动的社区开发版，具体可以访问下方链接获取更多社区版相关资源：https://community.transwarp.cn/article/detail?id=247
TDH（Transwarp Data Hub）社区版安装教程
星环科技TDH社区版: 前段时间社区版重新重磅推出，同时还推出了单机即可30秒一键启动的社区开发版，具体可以访问下方链接获取更多社区版相关资源：https://community.transwarp.cn/article/detail?id=247
Oracle ADG的基本概念
FC-Barcelona: 您好，请教一下两个疑问 1、 “以介质恢复的方式”指的啥。 2、最大保护模式下提供的是物理备库吗。
PostgreSQL之堆表存储（Heap Table）
RE:无影人: 好顶赞！多谢！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

数据源的港湾 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。