Spark初学之Spark的四个特点

天河第一厨师

已于 2022-11-02 03:05:33 修改

阅读量1.7k

点赞数 3

文章标签： spark 大数据分布式

于 2022-11-02 03:00:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73529477/article/details/127644630

版权

1.运行效率高：

为什么说运行效率高呢？

一是因为spark提供了一个全新的数据结构，这个是基于内存来做计算的，且当内存不足时还可以放入磁盘上去。整个流程是基于DAG（有向无环图）的执行引擎支持无环数据流；

二是因为整个spark是基于线程来运行的，线程的启动和销毁都由于进程；

2.易用性好：一是spark提供了多种操作语言的API：例如有Python、SQL、Scala、Java、R语言；

二是提供了非常多的高阶API，这些API在不同操作语言中都是类似的，大大降低了程序员的学习成本；

3.通用性强：spark提供了非常多的工具库，包括spark core、spark sql、spark streaming、MLib、GraphX，可以直接让我们在一个应用中使用多个工具库，其中，Spark SQL 提供了结构化的数据处理方式，Spark Streaming 主要针对流式处理任务（也是本书的重点），MLlib提供了很多有用的机器学习算法库，GraphX提供图形和图形并行化计算。

4.随处运行：一个是编写好的spark程序可以提交到多个资源平台上运行：local spark集群 yarn 支持其他的云平台；

二是spark框架可以和多种软件进行集成、方便我们对接不同的软件完成处理；

天河第一厨师

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark初学之Spark的四个特点

关于spark的初步了解
复制链接

扫一扫

天河第一厨师 CSDN认证博客专家 CSDN认证企业博客

码龄2年

1: 原创

180万+: 周排名

69万+: 总排名

1794: 访问

: 等级

13: 积分

0: 粉丝

3: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

Spark初学之Spark的四个特点 1795

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。