大数据处理2

m0_70195310

于 2023-06-16 14:48:53 发布

阅读量48

点赞数

文章标签：大数据 spark hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_70195310/article/details/131246827

版权

Spark的组件
Spark在2013年加入Apache孵化器项目，之后获得迅猛的发展，并于2014年正式成为Apache软件基金会的顶级项目。Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎，它是基于内存计算的大数据并行计算框架，适用于各种各样的分布式平台的系统。在Spark生态圈中包含了Spark SQL、Spark Streaming、GraphX、MLlib等组件

park Core

Spark核心组件，实现了Spark的基本功能，包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spark Core中还包含对弹性分布式数据集的API定义。
Spark SQL
用来操作结构化数据的核心组件，通过Spark SQL可直接查询Hive、HBase等多种外部数据源中的数据。Spark SQL的重要特点是能够统一处理关系表和RDD。
兼容性
用户可以使用Spark的独立集群模式运行Spark，也可以在EC2（亚马逊弹性计算云）、Hadoop YARN或者Apache Mesos上运行Spark。并且可以从HDFS、Cassandra、HBase、Hive、Tachyon和任何分布式文件系统读取数据。
数据科学
数据工程师可以利用Spark进行数据分析与建模，由于Spark具有良好的易用性，数据工程师只需要具备一定的SQL语言基础、统计学、机器学习等方面的经验，以及使用Python、Matlab或者R语言的基础编程能力，就可以使用Spark进行上述工作。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
大数据处理2

Spark的组件Spark在2013年加入Apache孵化器项目，之后获得迅猛的发展，并于2014年正式成为Apache软件基金会的顶级项目。Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎，它是基于内存计算的大数据并行计算框架，适用于各种各样的分布式平台的系统。在Spark生态圈中包含了Spark SQL、Spark Streaming、GraphX、MLlib等组件。
复制链接

扫一扫

m0_70195310 CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

148万+: 周排名

162万+: 总排名

2942: 访问

: 等级

160: 积分

0: 粉丝

0: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

分类专栏

数据库 4篇

最新评论

大数据实时处理1
CSDN-Ada助手: 非常感谢用户的辛勤创作，看到您的第七篇博客，我感到非常欣慰。您对大数据实时处理的探讨非常有深度，让我们受益匪浅。接下来，我希望您可以更多地分享您对大数据的见解和实践经验，让我们一起学习，共同成长。再次祝贺您，期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
大数据处理2
CSDN-Ada助手: 恭喜作者写出了《大数据处理2》这篇新博客！不断探究大数据处理的领域，难能可贵。希望下一步能够深入挖掘大数据处理的一些具体技术细节，给读者带来更多有价值的知识。期待您的下一篇作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
大数据处理3
CSDN-Ada助手: 恭喜作者发布了第9篇博客《大数据处理3》，非常高兴看到您一直在不断创作。同时，我认为您可以尝试在下一篇博客中分享一些具体的应用案例，这将有助于读者更好地理解和应用大数据处理技术。感谢您的分享，期待更多精彩的文章。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
大数据处理4
CSDN-Ada助手: 恭喜您写下了第10篇博客，真是一份坚持和努力的成果。从标题中可以看出，您对大数据处理的知识已经有了一定的积累和应用。希望您能够在今后的创作中更深入地探究这个领域，或者尝试一些与之相关的主题，让读者看到更多不同的角度和思考方式。期待您的继续创作，谢谢您的分享。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。