Spark的应用场景

最新推荐文章于 2024-06-17 15:07:18 发布

挽歌亽朽年

最新推荐文章于 2024-06-17 15:07:18 发布

阅读量5.5k

点赞数 1

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ghf183184/article/details/104341336

版权

Spark的生态圈
1.Spark的设计遵循“一个软件栈满足不同应用场景”的理念，逐渐形成一套完整的生态系统
2.Spark可以部署在资源管理器YARN之上，提供一站式大数据解决方案
3.Spark所提供的的生态系统可对应以下三种场景：
复杂的批量数据处理：通常时间跨度在数十分钟到数小时之间
基于历史数据的交互式查询：通常时间跨度在数十秒到数分钟之间
基于实时数据的数据处理：通常时间跨度在数百毫秒到数秒之间
在这里插入图片描述
4.Spark生态系统已经成为伯克利数据分析栈（BDAS）中重要的组成部分
5.Spark生态系统主要包括：
Spark Core
Spark SQL
Spark Streaming
MLlib
GraphX

Spark Core提供Spark最基础与最重要的功能，主要包括：
SparkContext：通常而言，Driver Application的执行与输出都是通过SparkContext来完成的，在正式提交Application之前，首先需要初始化SparkContext
只需要使用SparkContext提供的 API完成功能开发
Spark Core中包含了对RDD的API定义
Spark Core提供了创建和操作这些集合的多个API

Spark SQL是Spark用来

最低0.47元/天解锁文章

挽歌亽朽年

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Spark的应用场景

Spark的生态圈1.Spark的设计遵循“一个软件栈满足不同应用场景”的理念，逐渐形成一套完整的生态系统2.Spark可以部署在资源管理器YARN之上，提供一站式大数据解决方案3.Spark所提供的的生态系统可对应以下三种场景：复杂的批量数据处理：通常时间跨度在数十分钟到数小时之间基于历史数据的交互式查询：通常时间跨度在数十秒到数分钟之间基于实时数据的数据处理：通常时间跨度在数百毫秒...
复制链接

扫一扫

专栏目录

挽歌亽朽年 CSDN认证博客专家 CSDN认证企业博客

码龄5年

186: 原创

25万+: 周排名

61万+: 总排名

10万+: 访问

: 等级

2267: 积分

18: 粉丝

41: 获赞

4: 评论

139: 收藏

私信

关注

热门文章

分类专栏

MyBatis 4篇
SpringMVC 2篇
Tomcat 1篇
maven
SpringJDBC 6篇
s
MySQL 20篇
Scala 5篇
Springcloud 1篇
MongoMB 1篇
MongoDB 1篇
Redis 2篇
java 51篇
常用类 7篇
集合 6篇
指针 4篇
c语言 11篇
数据合并 1篇
数据分析 9篇
计算机基础 2篇
linux 17篇
pandas 2篇
hive 11篇
hadoop 1篇
python 19篇
spark 8篇
NumPy 2篇
c
Arrays类常用方法 1篇

最新评论

变量的指针和指向变量的指针变量
Song 4 u: 解决我的疑惑
Spark的应用场景
Deepturn: 分享技术,不错哦
JDBC 使用
Lansonli: 博主文章写得好，感悟颇深，感谢分享！有时间也来关注一下我的博文，可能有意想不到的惊喜喔~
三层架构
Lansonli: 博主文章写得好，感悟颇深，感谢分享！有时间也来关注一下我的博文，可能有意想不到的惊喜喔~

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。