数仓经典面试题
cts618
大数据高级工程师
展开
-
数仓经典面试题:插入不重复数据
如图所示:需求分析:(1)查出表A中的所有数据(2)查出表B中的所有数据(3)A表LEFT JOIN表B,如果表B中的id是null,则为A表中有数据,B表中没有数据SELECT* FROM a LEFT JOIN b a.id=b.id WHERE b.id is NULL;...原创 2021-06-06 14:15:23 · 75 阅读 · 0 评论 -
数仓经典面试题:商城活跃用户分析及红包功能分析
视频连接地址:https://www.bilibili.com/video/BV1PU4y1p7jP?p=7&spm_id_from=pageDriver题目:日志流水表:tmp_liujg_dau_based,以imp_date,qimei为主键,一个用户一天只出现一次,出现及表示当天登录1、计算2019年6月1日至今,每日DAU(活跃用户量,即有登陆的用户)2、计算20190601至今,每日领取红包的新用户数,老用户数,及人均领取金额,人均领取次数3、计算2019年3月,每个原创 2021-05-28 10:05:01 · 689 阅读 · 0 评论 -
数仓经典面试题四:统计每个店铺每个月的营业额以及截止到当前的历史累计额
一、数据准备store.txt数据:名称,月份,资金a,01,150a,01,200b,01,1000b,01,800c,01,250c,01,220b,01,6000a,02,2000a,02,3000b,02,1000b,02,1500c,02,350c,02,280a,03,350a,03,250二、创建表:create table t_store(name string,months int,money int )row format delimi原创 2021-05-23 09:28:26 · 446 阅读 · 0 评论 -
数仓经典面试题一:用户行为分析
题目要求:有如下表记录:需求:1,查询出每个用户最近一次登录的记录(每个用户只显示一条最近登录记录)及给出每个用户的登录总次数(同一天多次登录认为是一次)2,生成一张临时表,表名自定,四列数据,分别是Name,LastLogon,Num_logontime(要求:按时间给出每个人的登录次数,登录时间最早的为1,之后分别为2,3,4等),Num_logonday(要求:按天给出每个人的登录次数,同一天多次登录认为是同一次,最早的一次标记为1,之后的依次类推)需求实现:1,创建表create原创 2021-05-20 12:54:01 · 370 阅读 · 1 评论