几道经典的SQL面试题讲解①

本篇节选自书籍《对比Excel,轻松学习SQL数据分析》一书,主要讲解数据分析面试中常见的几道SQL面试题。

1 查询每个班学生数

现在有一张全校学生信息表stu_table,这张表存储了每位学生的id、name(姓名)、class(班级)、sex(性别)以及一些其他信息,现在我们想知道每个班有多少学生,该怎么实现呢?

stu_table表如下所示:

idnameclasssex
4张文华二班
3李思雨一班
1王小凤一班
7李智瑞三班
6徐文杰二班
8徐雨秋三班
5张青云二班
9孙皓然三班
10李春山三班
2刘诗迪一班

自己先想一下代码怎么写,然后再参考我的代码。

select 
    class
    ,count(id) as stu_num
from
    demo.stu_table
group by
    class

解题思路:

我们是要获取每个班的学生数,首先需要对班级进行分组,使用的是group by;然后再对每个组内的学生进行计数聚合运算,使用的count。最后运行结果如下:

classstu_num
二班3
一班3
三班4

2 查询每个班男女学生数

还是前面的全校学生信息表stu_table,现在我们想知道每个班男生女生分别有多少个?

自己先想一下代码怎么写,然后再参考我的代码。

select 
    class
    ,sex
    ,count(id) as stu_num
from
    demo.stu_table
group by
    class
    ,sex

解题思路:

与第一题不同的是,不仅需要每个班级的信息,还需要每个班级里面男女生分别的信息,主要考察的就是按照多列分组聚合的知识,直接在group by后面指明要分组的多列即可,且列与列之间用逗号分隔开。最后运行结果如下:

classsexstu_num
二班2
一班3
三班4
二班1

3 姓张的同学有多少个

还是前面的全校学生信息表stu_table,现在我们想知道这张表中姓张的同学有多少个?

自己先想一下代码怎么写,然后再参考我的代码。

select 
    count(id) as stu_num
from
    demo.stu_table
where name like "张%"

解题思路:

我们是要获取姓张的同学有多少个,首先需要思考的是怎么去判断同学是否姓张,假设我们表里面存储的姓名都是先姓后名的形式,那就可以用到字符串匹配函数like;知道怎么判断同学是否姓张,接下来就是把这些同学筛选出来,使用的是where条件;最后针对筛选出来的同学进行计数,使用的是count。最后运行结果如下:

stu_num
2

4 筛选出id第3-5的同学

还是前面的全校学生信息表stu_table,现在我们要获取id从小到大排序以后第3-5位的同学的信息。

自己先想一下代码怎么写,然后再参考我的代码。

select 
    *
from
    demo.stu_table
order by id asc
limit 2,3

解题思路:

我们要获取id从小到大排序以后第3-5位的同学,因为不确定id是否连续,所以我们没法直接用where条件来筛选id。我们先对id进行升序排列,然后再利用limit进行筛选。最后运行结果如下:

idnameclasssex
3李思雨一班
4张文华二班
5张青云二班

5 筛选出挂科的同学

现在有一张学生成绩表score_table,这张表存储了每位学生的id、name(姓名)、class(班级)、score(成绩),现在我们想要把挂科(成绩小于60)的同学信息筛选出来。

score_table表如下所示:

idnameclassscore
1王小凤一班88
2刘诗迪一班70
3李思雨一班92
4张文华二班55
5张青云二班77
6徐文杰二班77
7李智瑞三班56
8徐雨秋三班91
9孙皓然三班93
10李春山三班57

自己先想一下代码怎么写,然后再参考我的代码。

select 
    *
from
    demo.score_table
where score < 60

解题思路:

我们要获取挂科同学的信息,只需要加一个where条件用来限定挂科这个条件即可。最后运行结果如下:

idnameclassscore
4张文华二班55
7李智瑞三班56
10李春山三班57

6 筛选姓张的且挂科的同学

我们现在需要根据学生成绩表score_table查找出姓张的且挂科的同学的信息。

自己先想一下代码怎么写,然后再参考我的代码。

select 
    *
from
    demo.score_table
where score < 60
    and name like "张%"

解题思路:

这里面主要是用到了多条件筛选,多个条件之间用and进行关联即可。最后运行结果如下:

idnameclassscore
4张文华二班55

7 查询销冠获得次数

我们有一张表month_table记录了每月的销售冠军信息,这张表存储了每月销冠的id、name(姓名)、month_num(月份),现在需要获取销冠次数超过2次的人以及其对应的做销冠次数。

month_table表如下所示:

idnamemonth_num
E002王小凤1
E001张文华2
E003孙皓然3
E001张文华4
E002王小凤5
E001张文华6
E004李智瑞7
E002王小凤8
E003孙皓然9

自己先想一下代码怎么写,然后再参考我的代码。

select 
    id
    ,name
    ,count(month_num) num
from 
    demo.month_table
group by 
    id
    ,name
having 
    count(month_num) > 2

解题思路:

我们要获取销冠次数超过2次的人以及其对应的做销冠次数,首先需要获取每个人做销冠的次数,对id进行group by,然后在组内对month_num进行计数即可;然后再对分组聚合后的结果利用having进行条件筛选。最后结果如下:

idnamenum
E002王小凤3
E001张文华3

8 获取每个部门一整年业绩提升幅度

现在有一个月份销售额记录表sale_table,这个表记录了每年每月的销售额,现在我们想看下今年(2019年),月销售额最高涨幅是多少?

sale_table表如下所示:

year_nummonth_numsales
201912854
201924772
201933542
201941336
201953544
201812293
201822559
201832597
201842363

自己先想一下代码怎么写,然后再参考我的代码。

select 
    max(sales) as max_sales
 ,min(sales) as min_sales
    ,max(sales)-min(sales) as cha
    ,(max(sales)-min(sales))/min(sales) as growth
from 
    demo.sale_table
where 
    year_num = 2019

解题思路:

我们要获取今年的最大月涨幅,首先需要通过where条件把今年的每月数据销售额筛选出来;然后再在今年的月销售额里面寻找最大和最小的销售额,对两者进行做差,就是我们想要的结果。最后运行结果如下:

max_salesmin_saleschagrowth
4772133634362.5719

9 查找每科成绩大于70的学生

我们有一张学生科目成绩表score_info_table,这张表记录了每一位同学每一科目的成绩,每一位同学的每科成绩是一行,现在我们想要通过这张表获取到每科成绩都大于70分的学生。

score_info_table表如下所示:

idnamesubjectscore
1王小凤语文88
2张文华数学70
3徐雨秋英语92
1王小凤语文55
2张文华数学77
3徐雨秋英语77
1王小凤语文72
2张文华数学91
3徐雨秋英语93

自己先想一下代码怎么写,然后再参考我的代码。

select 
 id
    ,name
 from
    demo.score_info_table
 group by
    id
    ,name
 having 
    min(score) > 70    

解题思路:

我们是要获取每科成绩大于70的学生,只要能够保证最小成绩是大于70分的,就说明这位同学每科成绩都大于70分.所以第一步就是先获取每位同学的最小成绩,先对name进行group by分组,再在组内求最小值,然后将最小成绩大于70分的同学通过having筛选出来即可。最后运行结果如下:

idname
3徐雨秋

10 删除重复值

现在有一个学生信息表stu_info_table,这张表存储了每位学生id、name(姓名)、class(班级)、grade(年级),现在我们想获取这个学校所有年级以及所有班级的信息,即哪些年级有哪些班级,该怎么获取?

stu_info_table表如下所示:

idnameclassgrade
1王小凤一班一年级
2刘诗迪一班二年级
3李思雨一班一年级
4张文华二班二年级
5张青云二班一年级
6徐文杰二班二年级
7李智瑞一班一年级
8徐雨秋二班二年级
9孙皓然一班一年级

自己先想一下代码怎么写,然后再参考我的代码。

select
    grade
    ,class
from
    demo.stu_info_table
group by 
    grade
    ,class
order by
    grade

解题思路:

stu_table表中id列是主键,即不重复的,但是class和grade是重复的,多个id会属于同一个class和grade。我们只要class和grade信息,所以是需要对这两列进行去重,去重我们除了用distinct以外,还可以用group by。最后运行结果如下:

gradeclass
一年级一班
一年级二班
二年级一班
二年级二班




●解一道反常的Pandas题●12000+字超详细 SQL 语法速成!
后台回复“入群”即可加入小z干货交流群
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值