Spark基础与Java Api介绍

最新推荐文章于 2024-10-18 12:00:00 发布

yinni11

最新推荐文章于 2024-10-18 12:00:00 发布

阅读量187

点赞数

分类专栏：大数据---spark

大数据---spark 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、Spark简介

　　1、什么是Spark

　　　　发源于AMPLab实验室的分布式内存计算平台，它克服了MapReduce在迭代式计算和交互式计算方面的不足。

　　　　相比于MapReduce，Spark能充分利用内存资源提高计算效率。

　　2、Spark计算框架

　　　　Driver程序启动很多workers,然后workers在（分布式）文件系统中读取数据后转化为RDD（弹性分布式数据集），最后对RDD在内存中进行缓存和计算

3、为什么Spark计算速度快

　　　　（1）内存计算

　　　　（2）优化执行计划

4、Spark Api语言支持

　　　　（1）Scala

　　　　（2）Java

　　　　（3）Python

5、怎么运行Spark

　　　　Local本地模式、Spark独立集群、Mesos、Yarn-Standalone、Yarn-Client

转载于：https://www.cnblogs.com/tovin/p/3832405.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。