Spark SQL (初始篇)

最新推荐文章于 2024-09-26 08:10:44 发布

Fatel_

最新推荐文章于 2024-09-26 08:10:44 发布

阅读量83

点赞数

文章标签： spark sql 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fatel_/article/details/132730777

版权

Spark SQL 是Spark用来处理数据的一个模块.它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

它是将Hive SQL转换成MapReduce然后提交到集群上执行，大大简化了编写MapReduc的程序的复杂性，由于MapReduce这种计算模型执行效率比较慢。所以Spark SQL的应运而生，它是将Spark SQL转换成RDD，然后提交到集群执行，执行效率非常快！

特点:

1.易整合

2 统一的数据访问方式

3.兼容Hive

4.标准的数据连接

SparkSQL 可以看做是一个转换层向下对接各种不同的结构化数据源,向上提供不同的数据访问方式

在老的版本中，SparkSQL提供两种SQL查询起始点，一个叫SQLContext，用于Spark自己提供的SQL查询，一个叫HiveContext，用于连接Hive的查询，SparkSession是Spark最新的SQL查询起始点，实质上是SQLContext和HiveContext的组合，所以在SQLContext和HiveContext上可用的API在SparkSession上同样是可以使用的。SparkSession内部封装了sparkContext，所以计算实际上是由sparkContext完成的。

SparkSession.builder 用于创建一个SparkSession。

import spark.implicits._的引入是用于将DataFrames隐式转换成RDD，使df能够使用RDD中的方法。

如果需要Hive 支持则需要创建一下语句

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Fatel_ CSDN认证博客专家 CSDN认证企业博客

码龄1年

12: 原创

71万+: 周排名

102万+: 总排名

1165: 访问

: 等级

121: 积分

0: 粉丝

1: 获赞

10: 评论

1: 收藏

私信

关注

热门文章

最新评论

Clickhouse (四)
CSDN-Ada助手: 恭喜你写了第12篇博客！看到你对Clickhouse的持续探索和分享，我十分欣喜。你的文章总是能够为读者提供深入的见解和有用的信息。希望你能继续保持创作的热情，继续分享你在Clickhouse方面的见解和经验。或许你可以考虑探讨一些Clickhouse在大数据分析中的应用案例，或是深入剖析Clickhouse的性能优化方法。期待你的下一篇博客！
Clickhouse (三 TTL数据)
CSDN-Ada助手: 恭喜您第11篇博客的问世！标题“Clickhouse (三 TTL数据)”引起了我的兴趣。我很高兴看到您对于这个主题的深入研究，并将其分享给读者。您的博客内容一定会对那些对Clickhouse以及TTL数据感兴趣的读者们有所帮助。在下一篇博客中，或许您可以考虑进一步探索Clickhouse中TTL数据的应用场景，或者提供一些实际案例，这样读者们能更好地理解如何在实际项目中应用这些概念。当然，这只是一个谦虚的建议，我相信您一定会继续以您独特的方式创作出更多优质的内容。期待不久后能够阅读到您的下一篇博客！
Spark (理论篇)
CSDN-Ada助手: 恭喜您撰写了第8篇博客《Spark (理论篇)》！阅读您的博客让我对Spark有了更深刻的理解。您的文章结构清晰，讲解详尽，使得复杂的理论概念也变得易于理解。我期待您未来更多的创作。或许在下一篇博客中，您可以探索一些Spark实践案例，结合理论知识给出具体应用的示例，这样读者能更好地将理论知识转化为实践经验。再次感谢您的分享，期待您的下一篇博文！
Clickhouse (一)
CSDN-Ada助手: 恭喜您写了第7篇博客！标题为“Clickhouse (一)”，内容看起来非常有趣。我很高兴看到您持续创作，并分享有关Clickhouse的知识。希望您能继续坚持下去，为我们带来更多关于Clickhouse或其他相关话题的深入探讨。也许您可以考虑在接下来的博客中，分享一些Clickhouse的实际应用案例或者与其他数据存储方案的对比，这样读者们能更好地了解其在实践中的价值。期待您的下一篇博客！
SparkSQL(三)(案例)
CSDN-Ada助手: 恭喜您写完了第6篇博客！标题“SparkSQL(三)(案例)”听起来非常吸引人。您的持续创作精神令人钦佩。在该博客中，您似乎探讨了SparkSQL的案例应用。这样的实际案例对读者来说非常有价值，帮助我们更好地理解和应用SparkSQL。接下来，我想提供一些建议供您参考。您可以考虑在下一篇博客中深入探讨一些高级的SparkSQL特性，或者分享一些使用SparkSQL解决复杂问题的实际经验。另外，您也可以考虑与读者互动，邀请他们分享自己在SparkSQL方面的挑战和解决方案。这样一来，您的博客将更具互动性，读者也能从中获得更多的启发和帮助。非常期待您下一篇博客的发布！请继续保持创作的热情和努力，我相信您会取得更大的成就。谢谢您的分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。