spark_sql理解和使用

最新推荐文章于 2024-02-08 20:02:07 发布

武念

最新推荐文章于 2024-02-08 20:02:07 发布

阅读量1.9k

点赞数

文章标签： spark sql big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43813200/article/details/122590656

版权

spark sql 的特点

易集成
spark sql与spark程序无缝链接在一起，使得spark sql可以使用sql或DataFrame API在spark应用程序中处理结构化数据。语言支持方面spark sql 支持python、java、R、scala等语言。
同一的数据访问
spark sql 提供了一种访问各种数据源的通用方式。
数据源包含hive,avro,parquet,orc,json,jdbc等。
spark sql使用相同的方法链接数据，甚至跨源关联数据。
兼容hive
spark sql支持在hive上运行sql或者hivesql进行查询。
标准的数据链接
spark sql可以通过行业标准的JDBC或ODBC链接关系型数据

spark sql 的用途

根据基本的sql语句进行数据查询。
根据hiveSql语句进行查询
在hive、hbase、hdfs中读取数据
通过jdbc从关系型数据库中读取数据
从已存在的文件中读取数据

使用场景

需要处理结构化数据的场景
需要查询各种数据源的场景
需要兼容sql99，hivesql的场景
对数据处理的实时性要求不高的场景
处理PB级的大容量数据的场景
注意：spark sql 不适用与实时，交互式数据查询业务

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark_sql理解和使用

spark sql 的特点易集成spark sql与spark程序无缝链接在一起，使得spark sql可以使用sql或DataFrame API在spark应用程序中处理结构化数据。语言支持方面spark sql 支持python、java、R、scala等语言。同一的数据访问spark sql 提供了一种访问各种数据源的通用方式。数据源包含hive,avro,parquet,orc,json,jdbc等。spark sql使用相同的方法链接数据，甚至跨源关联数据。兼容hivespark
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

武念 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。