之前有人问我,如何挑出一个月的最大值及其特征,比如有三列,分别是user_id,item_id,time,其中time是停留时长,这个问题就是找出这个用户,他这一行是什么,我当时就懵逼了。我说我直接全部拉下来这个月的数据,然后py操作取最大值即可。。。game over
For Recommendation in Deep learning QQ Group 277356808
For deep learning QQ Second Group 629530787
I'm here waiting for you
下面分步进行,逐渐加深
1-按照time来排序获取一定时间内的点击曝光日志,从小到大的排序
既然是排序,那么肯定是用ORDER BY,如下是简单的按照单列(time)排序
SELECT user_id,item_id,time
FROM ClickLogTable
WHERE concat(datetime, dayhour) be
Hive SQL解决找出用户最大停留时长问题
本文介绍了如何使用Hive SQL找出特定时间段内用户的最大停留时长及其相关记录。通过按user_id和time排序,结合row_number()函数,确保数据正确排序,并通过限制结果只取最大值一行,提供了两种不同的解决方案。文章还提到了在处理时间字段时需要注意的字符串与浮点数排序差异。
订阅专栏 解锁全文
2353

被折叠的 条评论
为什么被折叠?



