Hive高级查询练习01(数据+过程)
一、每个店铺 top3
- 有 50w 个京东店铺,每个顾客访问任何一个店铺的任何一个商品时,都会产生一条访问日志,访问日志存储的表名为 visit,访客用户 id 为 user_id,被访问的店铺名称为 shop。
请统计:
数据:
u1 a
u2 b
u1 b
u1 a
u3 c
u4 b
u1 a
u2 c
u5 b
u4 b
u6 c
u2 c
u1 a
u2 a
u2 a
u3 a
u5 a
u5 a
u5 a
需求:
1.每个店铺 UV(访客数)
2.每个店铺访问次数 top3 的访客信息。输出店铺名、访客 id、访问次数。
建表以及导数据
create external table visit(
user_id STRING,
shop STRING
)
row format delimited fields terminated by ' ';
load data local inpath '/root/kb08/hive/homework/jd.txt' into table visit;
1.每个店铺 UV(访客数)
查询语句
select
shop,count(*) sumid
from
visit
group by
shop;
输出结果: