HIVE sparkSQL sum()over()开窗函数的效率问题

最新推荐文章于 2024-07-15 20:30:34 发布

LiaoQiang_big

最新推荐文章于 2024-07-15 20:30:34 发布

阅读量1.9k

点赞数

分类专栏：开发中的问题文章标签： hive c语言 c++

本文链接：https://blog.csdn.net/LiaoQiang_big/article/details/120551420

版权

开发中的问题专栏收录该内容

4 篇文章 0 订阅

订阅专栏

开窗函数大家都用过,其中sum()的开窗函数我们可以很好的用来求一些累加的值,我之前一直认为开窗函数的执行效率都差不多,然而有一次我使用sum开窗函数计算某个车辆每个时间累积行驶了多少距离,由于有定位数据,数据量比较大,300万左右,结果程序执行了超过一个小时都不出结果,然后我用排除法把sum换成row_number,结果秒出结果.我才发现sum的不同

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LiaoQiang_big

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
HIVE sparkSQL sum()over()开窗函数的效率问题

开窗函数大家都用过,其中sum()的开窗函数我们可以很好的用来求一些累加的值,我之前一直认为开窗函数的执行效率都差不多,然而有一次我使用sum开窗函数计算某个车辆每个时间累积行驶了多少距离,由于有定位数据,数据量比较大,300万左右,结果程序执行了超过一个小时都不出结果,然后我用排除法把sum换成row_number,结果秒出结果.我才发现sum的不同...
复制链接

扫一扫