spark_sql理解和使用

spark sql 的特点

  • 易集成
    spark sql与spark程序无缝链接在一起,使得spark sql可以使用sql或DataFrame API在spark应用程序中处理结构化数据。语言支持方面spark sql 支持python、java、R、scala等语言。
  • 同一的数据访问
    spark sql 提供了一种访问各种数据源的通用方式。
    数据源包含hive,avro,parquet,orc,json,jdbc等。
    spark sql使用相同的方法链接数据,甚至跨源关联数据。
  • 兼容hive
    spark sql支持在hive上运行sql或者hivesql进行查询。
  • 标准的数据链接
    spark sql可以通过行业标准的JDBC或ODBC链接关系型数据

spark sql 的用途

  • 根据基本的sql语句进行数据查询。
  • 根据hiveSql语句进行查询
  • 在hive、hbase、hdfs中读取数据
  • 通过jdbc从关系型数据库中读取数据
  • 从已存在的文件中读取数据

使用场景

  • 需要处理结构化数据的场景
  • 需要查询各种数据源的场景
  • 需要兼容sql99,hivesql的场景
  • 对数据处理的实时性要求不高的场景
  • 处理PB级的大容量数据的场景
  • 注意:spark sql 不适用与实时,交互式数据查询业务
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

武念

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值