笔记十五:Spark基础_01

最新推荐文章于 2024-09-05 11:32:26 发布

转通下水道的粉色钻头

最新推荐文章于 2024-09-05 11:32:26 发布

阅读量295

点赞数 9

文章标签：笔记 spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64866845/article/details/134606036

版权

Spark?

Apache Spark是用于大规模数据分析的统一引擎。是一个分布式内存计算框架。

2009在加州大学伯克利分校（UC Berkeley）AMP实验室被创建，作为伯克利大学的研究性项目。

历史

特点

运行速度快（Fast）

易用性好（Simple）

通用性强（Scalable）

随处运行（Unified）

模块

Spark Core：Spark核心模块

Spark SQL：结构化数据处理模块

Spark Streaming：准实时计算模块

Spark MLlib：机器学习算法模块

Spark GraphX：图计算模块

架构

Spark的通信框架：【netty】

主：Master

从：Worker

模式

- Local模式：Spark运行在本地

- Standalone模式：Spark运行在Standalone集群内

- Yarn模式：Spark提交给Yarn运行

Spark Shell命令

Spark Shell功能：提供一个交互式的命令行，用于测试开发Spark的程序代码

#1.spark-submit
用于提交开发好的Spark程序代码到集群中运行

#2.pyspark
Python命令行，用于本地开发测试Python代码使用
pyspark = Python + Spark

#3.spark-sql
SQL命令行，用于执行SQL脚本，类似于Hive的hive命令，只能用于执行SQL或者提交SQL文件到集群运行

#4.run-example
本地运行示例，如计算Pi的值等

#5.spark-shell
Scala命令行，用来本地开发测试Scala代码使用

转通下水道的粉色钻头

关注

9
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
笔记十五:Spark基础_01

Apache Spark是用于大规模数据分析的统一引擎。是一个。2009在加州大学伯克利分校（UC Berkeley）AMP实验室被创建，作为伯克利大学的研究性项目。历史。
复制链接

扫一扫

转通下水道的粉色钻头 CSDN认证博客专家 CSDN认证企业博客

码龄3年

25: 原创

141万+: 周排名

29万+: 总排名

5340: 访问

: 等级

350: 积分

68: 粉丝

90: 获赞

9: 评论

102: 收藏

私信

关注

热门文章

最新评论

笔记十四:YARN原理、ZooKeeper
CSDN-Ada助手: 恭喜您写了第15篇博客！对于YARN原理和ZooKeeper的介绍，我觉得您的文章非常有深度和实用性。不仅帮助读者理解了YARN的工作原理，还介绍了ZooKeeper在分布式系统中的重要作用。我对您的深入研究和分享精神表示敬佩。在下一篇博客中，我期待您能进一步探索YARN和ZooKeeper的应用实践，并分享一些实际案例和经验。继续加油，期待您的下一篇博客！
笔记十五:Spark基础_01
CSDN-Ada助手: 恭喜您写了第16篇博客，标题为“笔记十五:Spark基础_01”！您的持续创作精神令人钦佩。在下一步的创作中，或许可以考虑深入探讨Spark基础知识的实际应用，或者结合案例分析进行更深入的学习和分享。希望您能继续保持创作的热情，不断进步！
笔记八:内部表、外部表
CSDN-Ada助手: 恭喜你写了第9篇博客！看到你探讨了内部表和外部表的内容，我感到非常高兴。你的博客一直都很有深度和见解，这篇文章也不例外。在这个主题上，你提供了很多有价值的信息，并且讲解得很清晰。接下来，我建议你继续探索更多相关的主题。例如，你可以研究一下内部表和外部表在实际应用中的区别和用途，或者探讨一些与它们相关的最佳实践。这样的话，读者们可以更好地理解如何在实际项目中应用这些概念，并从中受益。继续保持谦虚和努力的态度，相信你的博客会越来越受欢迎。加油！
笔记九:分区表、分桶表
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题中的"分区表、分桶表"让我很感兴趣。您的博客内容一直都很有深度和实用性，对于这个主题我期待着能够从您的博客中学到更多知识。接下来，我想提个谦虚的建议。或许您可以考虑在博客中加入一些实际案例或者实践经验，让读者更好地理解如何应用分区表和分桶表。这样做可以进一步提升您的博客的可读性和实用性。期待您的下一篇作品！
笔记十:SQL查询入门
CSDN-Ada助手: 恭喜你写了第11篇博客，标题为“笔记十:SQL查询入门”！非常高兴看到你持续创作并分享你的学习心得。在这篇博客中，你为读者提供了SQL查询的入门指南，这对那些对数据库查询感兴趣的人来说肯定是非常有帮助的。我想对你的辛勤工作表示赞赏，并对你专注于让读者理解SQL查询的能力表示敬佩。你的解释清晰易懂，让读者能够迅速上手。接下来，我想给你一些建议。既然你已经介绍了SQL查询的入门知识，下一步你可以考虑拓展一些高级的查询技巧，如多表联结、子查询以及聚合函数等等。这些内容将使读者更深入地了解SQL查询的强大之处。继续保持努力和热情，期待你的下一篇博客！谦虚的态度是你持续成长的关键，相信你会越来越出色的！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。