python使用spark sql查询impala_使用SparkSQL阅读Impala表

最新推荐文章于 2023-04-22 21:58:17 发布

VIP文章 weixin_39841825

最新推荐文章于 2023-04-22 21:58:17 发布

阅读量513

点赞数

文章标签： python使用spark sql查询impala

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39841825/article/details/111456108

版权

我试图执行一个查询，该函数的功能类似于lead .. over ..分区和Union。当我试图在impala上运行它时，此查询效果很好，但在Hive上失败。使用SparkSQL阅读Impala表

我需要编写一个执行此查询星火工作。它在SparkSQL中也失败了，我的假设是因为Spark 1.6在内部使用HiveQL来完成上述任务。

有一些不同的方式来读取SparkSQL黑斑羚表？因为在Hive中工作的基本查询和Both都可以很好地与SprkSQL一起工作。

FYR我想查询运行：

SELECT issue_id,

CASE WHEN COALESCE(lead(created, 1) OVER (PARTITION BY issue_id ORDER BY created ASC,

field_sequence ASC), '') = '' THEN 'to' ELSE LEAD('from', 1) OVER (PARTITION BY issue_id ORDER BY created ASC, field_sequence ASC) END Status,

created StartDate,

LEAD(created, 1) OVER (PARTITION BY issue_id ORDER BY created ASC, field_sequence ASC) EndDate

FROM (

SELECT issue_id, created, field, 'from', 'to', field_sequence FROM tab1 WHERE COALESCE(LOWER(field), '') = 'status'

UNION

SELECT issue

最低0.47元/天解锁文章

weixin_39841825

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python使用spark sql查询impala_使用SparkSQL阅读Impala表

我试图执行一个查询，该函数的功能类似于lead .. over ..分区和Union。当我试图在impala上运行它时，此查询效果很好，但在Hive上失败。使用SparkSQL阅读Impala表我需要编写一个执行此查询星火工作。它在SparkSQL中也失败了，我的假设是因为Spark 1.6在内部使用HiveQL来完成上述任务。有一些不同的方式来读取SparkSQL黑斑羚表？因为在Hive中工作的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。