每天一道大厂SQL题【Day25】脉脉真题实战(一)每日活跃用户_用户每日登陆脉脉会访问app不同的模块,现有两个表 表1记录了每日脉脉活跃用户的ui

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

思路分析

(1) 创建表

– 表1 dau 记录了每日脉脉活跃用户的uid和不同模块的活跃时长

create or replace temporary view dau(d, uid, module, active_duration) as

values (‘2020-01-01’, 1, ‘jobs’, 324),

(‘2020-01-01’, 2, ‘feeds’, 445),

(‘2020-01-01’, 3, ‘im’, 345),

(‘2020-01-02’, 2, ‘network’, 765),

(‘2020-01-02’, 3, ‘jobs’, 342);

– 表2 users 脉脉所有用户得一些注册属性

create or replace temporary view users(uid, career_level, city, work_length) as

values (1, ‘中级人才’, ‘北京’, 4),

(2, ‘高级人才’, ‘上海’, 7),

(3, ‘初级人才’, ‘北京’, 1),

(4, ‘普通人才’, ‘平顶山’, 2);

(2) 思路
  1. 九月中,每日活跃的用户数

我们可以使用SQL语句来查询每日活跃的用户数。首先,我们需要筛选出九月份的数据,然后按日期分组,最后计算每组中不同用户的数量。

  1. 九月中,对于每日活跃用户,其当日活跃时长最大的模块

我们可以使用SQL语句来查询每日活跃用户当日活跃时长最大的模块。首先,我们需要筛选出九月份的数据,然后按日期和用户分组,最后计算每组中活跃时长最大的模块。

  1. 十一期间的活跃用户中,jobs模块活跃超过100s的用户

我们可以使用SQL语句来查询十一期间jobs模块活跃超过100s的用户。首先,我们需要筛选出十一期间jobs模块的数据,然后按用户分组,最后计算每组中活跃时长超过100s的用户。

答案获取

建议你先动脑思考,动手写一写再对照看下答案,如果实在不懂可以点击下方卡片,回复:大厂sql 即可。
参考答案适用HQL,SparkSQL,FlinkSQL,即大数据组件,其他SQL需自行修改。

加技术群讨论

点击下方卡片关注 联系我进群

或者直接私信我进群

附表

表1:maimai.dau

duidmoduleactive_duration列说明
2020-01-011jobs324d: 活 跃 的 日 期 uid:用户的唯一编码module:用户活跃模块actre.duration:该模块下对应的活跃时长(单位:s)
2020-01-012feeds445
2020-01-013im345
2020-01-022network765
2020-01-023jobs342

表2:maimai.users

uidcareer_levelcitywork_length列说明
1中级人才北京4uid:用户的唯一编码career level:人才级别
2高级人才上海7
3初级人才北京1city:用户所在城市work_length:用户工作年限
4普通人才平顶山2
文末SQL小技巧

提高SQL功底的思路。
1、造数据。因为有数据支撑,会方便我们根据数据结果去不断调整SQL的写法。
造数据语法既可以create table再insert into,也可以用下面的create temporary view xx as values语句,更简单。
其中create temporary view xx as values语句,SparkSQL语法支持,hive不支持。
2、先将结果表画出来,包括结果字段名有哪些,数据量也画几条。这是分析他要什么。
从源表到结果表,一路可能要走多个步骤,其实就是可能需要多个子查询,过程多就用with as来重构提高可读性。
3、要由简单过度到复杂,不要一下子就写一个很复杂的。
先写简单的select from table…,每个中间步骤都执行打印结果,看是否符合预期, 根据中间结果,进一步调整修饰SQL语句,再执行,直到接近结果表。

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**

需要这份系统化资料的朋友,可以戳这里获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值