Spark---spark Sql建立临时表进行查询

建立临时表的两种数据源情况及处理方法

当外部文件是json文件的时候是最便捷的时候,此时直接使用spark sql的上下文环境将外部数据文件读进来即可
这个时候,读取进来的是直接的没有问题的DF数据集,每个json的key就是schema的字段名。这个时候直接建立临时表并查询即可

当外部文件非json文件,只是简单的结构性数据的时候,需要先用spark core的形式将数据读取进来,此时数据的格式是RDD,这个时候,·需要将RDD转成DF,在这个过程中未RDD加上schema,最后在建立临时表即可。

RDD转DF可以见我的另一篇博文
建立临时表要是DF去调用createOrReplaceTempView()函数方法

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值