hive面试题--连续性问题

最新推荐文章于 2023-08-14 16:14:02 发布

Xzchen555

最新推荐文章于 2023-08-14 16:14:02 发布

阅读量1.4k

点赞数

文章标签： hive sql

本文链接：https://blog.csdn.net/cc_jjj/article/details/121096571

版权

背景

面试和工作中经常遇到，用sql/hive求出连续N天登录或者连续N天销售额破万的记录等。

数据准备

--新建表与导入数据
use test;
create table if not exists log_info
(uid string,
log_date string)
row format delimited fields terminated by ',';

insert into table log_info values('A','20210901'),
                    ('A','20210902'),('A','20210903')
                    ,('B','20210901'),('B','20210903')
                    ,('v','20210830'),('K','20210902')
                    ,('C','20210903'),('B','20210902')
                    ,('D','20210905');


hive> select * from log_info;
OK
A	20210901
A	20210902
A	20210903
B	20210901
B	20210903
v	20210830
K	20210902
C	20210903
B	20210902
D	20210905

思路一

--先将uid对组内的登录时间升序排名rank1，然后将日期与rank1相减。
--因为这两个标签都是按照

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Xzchen555

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
hive面试题--连续性问题

背景面试和工作中经常遇到，用sql/hive求出连续N天登录或者连续N天销售额破万的记录等。数据准备--新建表与导入数据use test;create table if not exists log_info(uid string,log_date string)row format delimited fields terminated by ',';insert into table log_info values('A','20210901'),
复制链接

扫一扫