牛客-SQL大厂真题(某音)

牛客网SQL大厂真题部分贴近实际业务场景,做的时候是觉得比较难的,在这里回顾几种典型题型,整理解题思路和注意点。

SQL 156 各个视频的平均完播率(表连接、子查询)

计算2021年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序。(结束观看时间与开始播放时间的差>=视频时长时,视为完成播放。)

思路

  • 判断是否完成播放,子查询添加相应字段(if_end)并连接两表和筛选时间条件。分组聚合计算完播率,按顺序输出。

注意点

  1. 使用子查询避免select子句过于繁琐。
  2. 这里if(end_time-start_time>=duration,1,0)相对于case when会更简洁。
  3. sum和count的适用情况。
select video_id,round(sum(if_end)/count(if_end),3) avg_comp_play_rate
from 
(select video_id,
    if(end_time-start_time>=duration,1,0) if_end
from tb_user_video_log a
left join tb_video_info b using(video_id)
where year(start_time) = 2021) t1
group by video_id
order by avg_comp_play_rate desc

SQL 157 平均播放进度大于60%的视频类别(表连接、子查询、常见函数)

计算各类视频的平均播放进度,将进度大于60%的类别输出。(当播放时长大于视频时长时,播放进度均记为100%。)

思路

  • 和上一题类似,子查询添加字段判断是否完成播放,再计算完播率。

注意点

  • 各种函数的用法。时间函数timestampdiff表示两个时间的间隔,可以灵活设置单位参数,这里不要直接把两个时间相减。substring_index提取字符串文本。
select tag,concat(round(100*avg(view_time/duration),2),'%') avg_play_progress 
from 
(select tag,duration,if(timestampdiff(second,start_time,end_time)>=duration,duration,timestampdiff(second,start_time,end_time)) view_time
from tb_user_video_log
left join tb_video_info using(video_id)
) t1
group by tag
having substring_index(avg_play_progress,'%',1) > 60
order by avg_play_progress desc

SQL 158 每类视频近一个月的转发量/率(表连接、where子查询)

统计在有用户互动的最近一个月(按包含当天在内的近30天算,比如10月31日的近30天为10.2~10.31之间的数据)中,每类视频的转发量和转发率(保留3位小数)。注:转发率=转发量÷播放量

思路

  • 理解近一个月怎么表示,然后删选近一个月的数据,分组聚合计算转发率。

注意点

  • where子句不能用聚合函数,所以采用子查询表示最近三十天。子查询里date_sub找到与当前日期间隔三十天的日期。
select tag,sum(if_retweet) retweet_cut,
    round(sum(if_retweet)/count(start_time),3) retweet_rate
from tb_user_video_log a
left join tb_video_info b using(video_id)
where date(start_time) > 
    (select date_sub(max(start_time),interval 30 day)
    from tb_user_video_log)
group by tag
order by retweet_rate desc

SQL 159 每个创作者每月的涨粉率及截止当前的总粉丝量(窗口函数,表连接、子查询、case when)

计算2021年里每个创作者每月的涨粉率及截止当月的总粉丝量。

思路

  • 涨粉率通过计算字段得到,和前面类似。当月的总粉丝量是综合前面每个月的涨粉情况合计出来的,所以要用聚合窗口函数sum计算累计到每个月的粉丝数。

注意点

  1. case when表示不同的关注情况。
  2. 窗口函数的目标和用法。
  3. group by不能写“month”,因为group by先于select执行,这个时候还没有month字段。
select 
    author,
    date_format(start_time,'%Y-%m') month,
    round(sum(
        case when if_follow=1 then 1
             when if_follow=2 then -1
             else 0 end
        )/count(start_time),3) fans_growth_rate,
    sum(sum(
        case when if_follow=1 then 1
             when if_follow=2 then -1
             else 0 end)) 
    over (partition by author order by date_format(start_time,'%Y-%m')) total_fans
from tb_video_info
join tb_user_video_log using(video_id)
where year(start_time)=2021
group by author,date_format(start_time,'%Y-%m')
order by author,total_fans

SQL 160 国庆期间每类视频点赞量和转发量(窗口函数,表连接、外查询)

统计2021年国庆头3天每类视频每天的近一周总点赞量和一周内最大单天转发量,结果按视频类别降序、日期升序排序。假设数据库中数据足够多,至少每个类别下国庆头3天及之前一周的每天都有播放记录。

思路

  • 1、分组后先求和每天的点赞和转发 2、用窗口函数求每天一周内的点赞总和以及最大转发数。3、选择国庆三天的数据。

注意点

  1. 时间范围为9.25-10.3,where过滤到其他无用数据。
  2. 7天总和要用到两个sum,内层的是每天的多条数据求和。
with t1 as (
select  tag,date_format(start_time,'%Y-%m-%d') dt,
		sum(sum(if_like))over(partition by tag order by date_format(start_time,'%Y-%m-%d') rows 6 preceding) sum_like_cnt_7d	,
        max(sum(if_retweet))over(partition by tag order by date_format(start_time,'%Y-%m-%d') rows 6 preceding)	max_retweet_cnt_7d
from tb_user_video_log JOIN tb_video_info USING(video_id)
where datediff('2021-10-03',date_format(start_time,'%Y-%m-%d'))<9
group by  dt,tag
)
select * from t1 where dt between '2021-10-01' and '2021-10-03' order by tag desc,dt asc;

SQL 161 近一个月发布的视频中热度最高的top3视频(表连接、子查询、datediff)

找出近一个月发布的视频中热度最高的top3视频。

思路

  • 子查询定义各个指标,并且筛选时间为最近30天,然后外层将各个字段代入公式。

注意点

  1. 用datediff求最近无播放天数,即该视频最后播放日期和当前日期的时间差。
  2. date_sub找到当前日期的前30天,设置日期范围。
select 
    video_id,
    round((100*wb+5*dz+3*pl+2*zf)/(d_cnt+1),0) hot_index
from 
    (select 
        video_id,
        avg(timestampdiff(second,start_time,end_time)>= duration) wb,
        sum(if_like) dz,
        count(comment_id) pl,
        sum(if_retweet) zf,
        datediff((select max(date(end_time)) from tb_user_video_log),max(date(end_time))) d_cnt
     from tb_user_video_log join tb_video_info using(video_id)
     where datediff(date((select max(end_time) from tb_user_video_log)), date(release_time)) <= 29 #理解题意是发布后的一个月内,而不是从最近的日期往前推一个月的时间范围。
     group by video_id) t1
order by hot_index desc
limit 3 

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
题目要求:给定一个二叉树和一个整数target,找出所有从根节点到叶子节点路径之和等于target的路径。 解题思路:可以使用深度优先搜索(DFS)的方法来解决该问题。首先定义一个辅助函数来进行递归搜索,该辅助函数的参数包括当前节点、当前路径、当前路径的和以及目标和。在搜索过程中,需要维护一个数组来保存当前节点到根节点的路径。搜索过程如下: 1. 如果当前节点为空,则返回。 2. 将当前节点的值添加到当前路径中。 3. 将当前节点的值累加到当前路径的和中。 4. 如果当前节点是叶子节点,且当前路径的和等于目标和,则将当前路径添加到结果中。 5. 递归地搜索当前节点的左子树和右子树,并传递更新后的当前路径和当前路径的和。 最后,在主函数中调用辅助函数,并返回结果即可。 以下是题目的完整代码实现: ```python class TreeNode: def __init__(self, val=0, left=None, right=None): self.val = val self.left = left self.right = right def pathSum(root, target): def dfs(node, path, path_sum, target, res): if not node: return path.append(node.val) path_sum += node.val if not node.left and not node.right: # 当前节点是叶子节点 if path_sum == target: res.append(path[:]) # 注意需要复制一份path,否则会出现问题 dfs(node.left, path, path_sum, target, res) dfs(node.right, path, path_sum, target, res) path.pop() # 回溯到父节点,去掉当前节点 path_sum -= node.val res = [] dfs(root, [], 0, target, res) return res ``` 这样就能找出所有满足路径和等于目标和的路径了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值