[hive] 蚂蚁金服的两道sql题

最新推荐文章于 2024-04-28 16:11:59 发布

VIP文章朱同学

最新推荐文章于 2024-04-28 16:11:59 发布

阅读量1k

点赞数

分类专栏： hive 文章标签： sql hive 蚂蚁金服

本文链接：https://blog.csdn.net/a755199443/article/details/103051811

版权

题目

背景说明：
以下表记录了用户每天的蚂蚁森林低碳生活领取的记录流水。
table_name：user_low_carbon
user_id data_dt low_carbon
用户日期减少碳排放（g）

蚂蚁森林植物换购表，用于记录申领环保植物所需要减少的碳排放量
table_name: plant_carbon
plant_id plant_name low_carbon
植物编号植物名换购植物所需要的碳

----题目
1.蚂蚁森林植物申领统计
问题：假设2017年1月1日开始记录低碳数据（user_low_carbon），假设2017年10月1日之前满足申领条件的用户都申领了一颗p004-胡杨，
剩余的能量全部用来领取“p002-沙柳” 。
统计在10月1日累计申领“p002-沙柳” 排名前10的用户信息；以及他比后一名多领了几颗沙柳。
得到的统计结果如下表样式：
user_id plant_count less_count(比后一名多领了几颗沙柳)
u_101 1000 100
u_088 900 400
u_103 500 …

2、蚂蚁森林低碳用户排名分析
问题：查询user_low_carbon表中每日流水记录，条件为：
用户在2017年，连续三天（或以上）的天数里，
每天减少碳排放（low_carbon）都超过100g的用户低碳流水。
需要查询返回满足以上条件的user_low_carbon表中的记录流水。
例如用户u_002符合条件的记录如下，因为2017/1/2~2017/1/5连续四天的碳排放量之和都大于等于100g：
seq（key） user_id data_dt low_carbon
xxxxx10 u_002 2017/1/2 150
xxxxx11 u_002 2017/1/2 70
xxxxx12 u_002 2017/1/3 30
xxxxx13 u_002 2017/1/3 80
xxxxx14 u_002 2017/1/4 150
xxxxx14 u_002 2017/1/5 101
备注：统计方法不限于sql、procedure、python,java等

数据

user_low_carbon：
u_001 2017/1/1 10
u_001 2017/1/2 150
u_001 2017/1/2 110
u_001 2017/1/2 10
u_001 2017/1/4 50
u_001 2017/1/4 10
u_001 2017/1/6 45
u_001 2017/1/6 90
u_002 2017/1/1 10
u_002 2017/1/2 150
u_002 2017/1/2 70
u_002 2017/1/3 30
u_002 2017/1/3 80
u_002 2017/1/4 150
u_002 2017/1/5 101
u_002 2017/1/6 68
…

plant_carbon：
p001 梭梭树 17
p002 沙柳 19
p003 樟子树 146
p004 胡杨 215
…

解答

建表
drop table if exists user_low_carbon;
create table user_low_carbon
(
user_id string,
data_dt string,
low_carbon int
)
row format delimited fields terminated by '\t';

drop table if exists plant_carbon;
create table plant_carbon
(
plant_id string,
plant_name string,
low_carbon int
)
row format delimited fields terminated by '\t';

load data local inpath '/root/in/user_low_carbon' into table user_low_carbon;
load data local inpath '/root/in/plant_carbon' into table plant_carbon;

1
获得2017年1月1日至2017年10月1日之间用户累积的减少碳排放
select 
user_id,
sum(low_carbon) `sum`
from
user_low_carbon
where 
date_format(regexp_replace(data_dt,'/','-'),'yyyy')

最低0.47元/天解锁文章

朱同学

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
[hive] 蚂蚁金服的两道sql题

题目背景说明：以下表记录了用户每天的蚂蚁森林低碳生活领取的记录流水。table_name：user_low_carbonuser_id data_dt low_carbon用户日期减少碳排放（g）蚂蚁森林植物换购表，用于记录申领环保植物所需要减少的碳排放量table_name: plant_carbonplant_id plant_name low_car...
复制链接

扫一扫