2022.1.1 大数据学习01 Spark简介

最新推荐文章于 2024-10-17 11:20:37 发布

燕大扎克伯格

最新推荐文章于 2024-10-17 11:20:37 发布

阅读量134

点赞数 2

分类专栏：大数据 Spark 文章标签： spark big data hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yumiao168/article/details/122265244

版权

大数据同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

Spark简介：

Spark的诞生是基于解决Hadoop数据处理慢的问题 Spark 2013年6月成为Apache基金会下成员。

与Hadoop不同：

提示：这里可以添加要学的内容
1.Spark是一种包含流处理能力的处理框架，主要侧重于内存计算以及处理优化机制加快批处理的工作负载的运行速度。
2.Hadoop 基于一次性数据计算：框架在处理数据的时候，会从存储设备中读取数据，进行逻辑操作，然后将处理的结果重新存储到我们的介质中。 Mapper Reduce过程磁盘io严重影响性能

3.Spark提供了更加丰富的数据处理模型，基于内存进行数据的多次迭代，可以更好支持数据挖掘算法和图形计算。
4.实际应用场景如果内存限制较大，则仍会选用Mapper Reduce

Spark的核心模块：

提示：这里可以添加计划学习的时间
例如：
1、 Apache Spark Core：整个Spark的核心，其他的模块都是基于core来实现的
2、 Spark SQL：Spark操作结构化数据的功能模块
3、 Spark Streaming：Spark对流式数据进行处理的功能模块
4、Spark Milb：对机器学习相关进行处理
5、Sparl Graphx：对图形挖掘进行处理
Spark的核心模块

学习产出：

提示：这里统计学习计划的总量
例如：
1、CSDN 技术博客 1 篇

燕大扎克伯格

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

燕大扎克伯格 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。