每天一道大厂SQL题【Day02】电商场景TopK统计_有50w个京东店铺,每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问(1)

本文介绍了如何使用SQL查询技术统计每个店铺的访客数和每个店铺访问次数最多的前三名访客信息,方法包括按店铺和用户ID分组、计数排序和限制输出数量。
摘要由CSDN通过智能技术生成

user_id string, shop string )
ROW format delimited FIELDS TERMINATED BY ‘\t’;
INSERT INTO TABLE test_sql.test2 VALUES ( ‘u1’, ‘a’ ),
( ‘u2’, ‘b’ ),
( ‘u1’, ‘b’ ),
( ‘u1’, ‘a’ ),
( ‘u3’, ‘c’ ),
( ‘u4’, ‘b’ ),
( ‘u1’, ‘a’ ),
( ‘u2’, ‘c’ ),
( ‘u5’, ‘b’ ),
( ‘u4’, ‘b’ ),
( ‘u6’, ‘c’ ),
( ‘u2’, ‘c’ ),
( ‘u1’, ‘b’ ),
( ‘u2’, ‘a’ ),
( ‘u2’, ‘a’ ),
( ‘u3’, ‘a’ ),
( ‘u5’, ‘a’ ),
( ‘u5’, ‘a’ ),
( ‘u5’, ‘a’ );


### 思路分析


1 每个店铺的UV(访客数)  
 使用 SQL 或者其他数据库查询语言进行统计。  
 先通过 group by 按店铺名称进行分组,然后使用 count(distinct user\_id) 计算每个店铺的访客数。  
 2 每个店铺访问次数top3的访客信息  
 使用 SQL 或者其他数据库查询语言进行统计。  
 先通过 group by 按店铺名称和用户id进行分组,然后使用 count(\*) 计算每个用户在每个店铺的访问次数。  
 使用 order by 对访问次数进行排序,然后使用 limit 3 限制输出的数量。  
 输出店铺名称、访客id、访问次数。


### 答案获取


建议你先动脑思考,动手写一写再对照看下答案,如果实在不懂可以点击下方卡片,回复:`大厂sql` 即可。  
 参考答案适用HQL,Spark
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值