来 源:CSDN
SQL在数据分析中举足轻重,学习SQL实战也是必不可少,经典的50题要是能熟练,相信就没有大问题了,这篇文章分享给各位小伙伴,一起来学习吧!
【重要】
select …组函数(MIN/MAX/SUM/AVG/COUNT)
from …join … on …左外连接:left join … on … 右外连接: right join … on …
where …
group by …(oracle,SQL server中出现在select 子句后的非分组函数,必须出现在 group by子句后)
having …用于过滤 组函数
order by …asc 升序, desc 降序
limit (0,4)限制N条数据 如: topN数据
union 并集
union all(有重复)
intersect 交集
minus 相减
常见的SQL面试题:经典50题
已知有如下4张表:
根据以上信息按照下面要求写出对应的SQL语句。
一、创建数据库和表
为了演示题目的运行过程,我们先按下面语句在客户端navicat中创建数据库和表。
如何你还不懂什么是数据库,什么是客户端navicat,可以先学习这个:
1.创建表1)创建学生表(student)
按下图在客户端navicat里创建学生表。
学生表的“学号”列设置为主键约束,下图是每一列设置的数据类型和约束
创建完表,点击“保存”
2)创建成绩表(score)
3)创建课程表(course)
4)教师表(teacher)
教师表的“教师号”列设置为主键约束, 教师姓名这一列设置约束为“null”(红框的地方不勾选),表示这一列允许包含空值(null)。
向表中添加数据
1)向学生表里添加数据
添加数据的sql
insertintostudent(学号,姓名,出生日期,性别)
values( ‘0001’, ‘猴子’, ‘1989-01-01’, ‘男’);
在客户端navicat里的操作
50道面试题
为了方便学习,我将50道面试题进行了分类
1.查询姓“猴”的学生名单
2.汇总统计分组分析
面试题:查询课程编号为“0002”的总成绩
–分析思路
–select 查询结果 [总成绩:汇总函数sum]
–from 从哪张表中查找数据[成绩表score]
–where 查询条件 [课程号是0002]
selectsum(成绩)
fromscore
where课程号 = ‘0002’;
查询选了课程的学生人数
–这个题目翻译成大白话就是:查询有多少人选了课程
–select 学号,成绩表里学号有重复值需要去掉
–from 从课程表查找score;
selectcount( distinct学号) as学生人数
fromscore;
查询各科成绩最高和最低的分, 以如下的形式显示:课程号,最高分,最低分
/*
分析思路
select 查询结果 [课程ID:是课程号的别名,最高分:max(成绩) ,最低分:min(成绩)]
from 从哪张表中查找数据 [成绩表score]
where 查询条件 [没有]
group by 分组 [各科成绩:也就是每门课程的成绩,需要按课程号分组];
*/
select课程号, max(成绩) as最高分, min(成绩) as最低分
fromscore
groupby课程号;
查询每门课程被选修的学生数
/*
分析思路
select 查询结果 [课程号,选修该课程的学生数:汇总函数count]
from 从哪张表中查找数据 [成绩表score]
where 查询条件 [没有]
group by 分组 [每门课程:按课程号分组];
*/
select课程号, count(学号)
fromscore
groupby课程号;
查询男生、女生人数
/*
分析思路
select 查询结果 [性别,对应性别的人数:汇总函数count]
from 从哪张表中查找数据 [性别在学生表中,所以查找的是学生表student]
where 查询条件 [没有]
group by 分组 [男生、女生人数:按性别分组]
having 对分组结果指定条件 [没有]
order by 对查询结果排序[没有];
*/
select性别, count(*)
fromstudent
groupby性别;
查询平均成绩大于60分学生的学号和平均成绩
/*
题目翻译成大白话:
平均成绩:展开来说就是计算每个学生的平均成绩
这里涉及到“每个”就是要分组了
平均成绩大于60分,就是对分组结果指定条件
分析思路
select 查询结果 [学号,平均成绩:汇总函数avg(成绩)]
from 从哪张表中查找数据 [成绩在成绩表中,所以查找的是成绩表score]
where 查询条件 [没有]
group by 分组 [平均成绩:先按学号分组,再计算平均成绩]
having 对分组结果指定条件 [平均成绩大于60分]
*/
select学号, avg(成绩)
fromscore
groupby学号
havingavg(成绩)> 60;
查询至少选修两门课程的学生学号
/*
翻译成大白话:
第1步,需要先计算出每个学生选修的课程数据,需要按学号分组
第2步,至少选修两门课程:也就是每个学生选修课程数目>=2,对分组结果指定条件
分析思路
select 查询结果 [学号,每个学生选修课程数目:汇总函数count]
from 从哪张表中查找数据 [课程的学生学号:课程表score]
where 查询条件 [至少选修两门课程:需要先计算出每个学生选修了多少门课,需要用分组,所以这里没有where子句]
group by 分组 [每个学生选修课程数目:按课程号分组,然后用汇总函数count计算出选修了多少门课]
having 对分组结果指定条件 [至少选修两门课程:每个学生选修课程数目>=2]
*/
select学号, count(课程号) as选修课程数目
fromscore
groupby学号
havingcount(课程号)>= 2;
查询同名同性学生名单并统计同名人数
/*
翻译成大白话,问题解析:
1)查找出姓名相同的学生有谁,每个姓名相同学生的人数
查询结果:姓名,人数
条件:怎么算姓名相同?按姓名分组后人数大于等于2,因为同名的人数大于等于2
分析思路
select 查询结果 [姓名,人数:汇总函数count(*)]
from 从哪张表中查找数据 [学生表student]
where 查询条件 [没有]
group by 分组 [姓名相同:按姓名分组]
having 对分组结果指定条件 [姓名相同:count(*)>=2]
order by 对查询结果排序[没有];
*/
select姓名, count(*) as人数
fromstudent
groupby姓名
havingcount(*)>= 2;
查询不及格的课程并按课程号从大到小排列
/*
分析思路
select 查询结果 [课程号]
from 从哪张表中查找数据 [成绩表score]
where 查询条件 [不及格:成绩 <60]
group by 分组 [没有]
having 对分组结果指定条件 [没有]
order by 对查询结果排序[课程号从大到小排列:降序desc];
*/
select课程号
fromscore
where成绩< 60
orderby课程号 desc;
查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列
/*
分析思路
select 查询结果 [课程号,平均成绩:汇总函数avg(成绩)]
from 从哪张表中查找数据 [成绩表score]
where 查询条件 [没有]
group by 分组 [每门课程:按课程号分组]
having 对分组结果指定条件 [没有]
order by 对查询结果排序[按平均成绩升序排序:asc,平均成绩相同时,按课程号降序排列:desc];
*/
select课程号, avg(成绩) as平均成绩
fromscore
groupby课程号
orderby平均成绩 asc,课程号 desc;
检索课程编号为“0004”且分数小于60的学生学号,结果按按分数降序排列
/*
分析思路
select 查询结果 []
from 从哪张表中查找数据 [成绩表score]
where 查询条件 [课程编号为“04”且分数小于60]
group by 分组 [没有]
having 对分组结果指定条件 []
order by 对查询结果排序[查询结果按按分数降序排列];
*/
select学号
fromscore
where课程号= '04’and成绩 < 60
orderby成绩 desc;
统计每门课程的学生选修人数(超过2人的课程才统计)
要求输出课程号和选修人数,查询结果按人数降序排序,若人数相同,按课程号升序排序
/*
分析思路
select 查询结果 [要求输出课程号和选修人数]
from 从哪张表中查找数据 []
where 查询条件 []
group by 分组 [每门课程:按课程号分组]
having 对分组结果指定条件 [学生选修人数(超过2人的课程才统计):每门课程学生人数>2]
order by 对查询结果排序[查询结果按人数降序排序,若人数相同,按课程号升序排序];
*/
select课程号, count(学号) as’选修人数’
fromscore
groupby课程号
havingcount(学号)> 2
orderbycount(学号) desc,课程号 asc;
查询两门以上不及格课程的同学的学号及其平均成绩
/*
分析思路
先分解题目:
1)[两门以上][不及格课程]限制条件
2)[同学的学号及其平均成绩],也就是每个学生的平均成绩,显示学号,平均成绩
分析过程:
第1步:得到每个学生的平均成绩,显示学号,平均成绩
第2步:再加上限制条件:
1)不及格课程
2)两门以上[不及格课程]:课程数目>2
/*
第1步:得到每个学生的平均成绩,显示学号,平均成绩
select 查询结果 [学号,平均成绩:汇总函数avg(成绩)]
from 从哪张表中查找数据 [涉及到成绩:成绩表score]
where 查询条件 [没有]
group by 分组 [每个学生的平均:按学号分组]
having 对分组结果指定条件 [没有]
order by 对查询结果排序[没有];
*/
select学号, avg(成绩) as平均成绩
fromscore
groupby学号;
/*
第2步:再加上限制条件:
1)不及格课程
2)两门以上[不及格课程]
select 查询结果 [学号,平均成绩:汇总函数avg(成绩)]
from 从哪张表中查找数据 [涉及到成绩:成绩表score]
where 查询条件 [限制条件:不及格课程,平均成绩<60]
group by 分组 [每个学生的平均:按学号分组]
having 对分组结果指定条件 [限制条件:课程数目>2,汇总函数count(课程号)>2]
order by 对查询结果排序[没有];
*/
select学号, avg(成绩) as平均成绩
fromscore
where成绩 < 60
groupby学号
havingcount(课程号)>= 2;
如果上面题目不会做,可以复习这部分涉及到的sql知识:
3.复杂查询
查询所有课程成绩小于60分学生的学号、姓名
【知识点】子查询
1.翻译成大白话
1)查询结果:学生学号,姓名 2)查询条件:所有课程成绩 < 60 的学生,需要从成绩表里查找,用到子查询
第1步,写子查询(所有课程成绩 < 60 的学生)
select 查询结果[学号]
from 从哪张表中查找数据[成绩表:score]
where 查询条件[成绩 < 60]
group by 分组[没有]
having 对分组结果指定条件[没有]
order by 对查询结果排序[没有]
limit 从查询结果中取出指定行[没有];
select学号
fromscore
where成绩 < 60;
第2步,查询结果:学生学号,姓名,条件是前面1步查到的学号
select 查询结果[学号,姓名]
from 从哪张表中查找数据[学生表:student]
where 查询条件[用到运算符in]
group by 分组[没有]
having 对分组结果指定条件[没有]
order by 对查询结果排序[没有]
limit 从查询结果中取出指定行[没有];
select学号,姓名
fromstudent
where学号 in(
select学号
fromscore
where成绩 < 60
);
查询没有学全所有课的学生的学号、姓名
/*
查找出学号,条件:没有学全所有课,也就是该学生选修的课程数 < 总的课程数
【考察知识点】in,子查询
*/
select学号,姓名
fromstudent
where学号 in(
select学号
fromscore
groupby学号
havingcount(课程号) < ( selectcount(课程号) fromcourse)
);
查询出只选修了两门课程的全部学生的学号和姓名
select学号,姓名
fromstudent
where学号 in(
select学号
fromscore
groupby学号
havingcount(课程号)= 2
);
1990年出生的学生名单
/*
查找1990年出生的学生名单
学生表中出生日期列的类型是datetime
*/
select学号,姓名
fromstudent
whereyear(出生日期)= 1990;
查询各科成绩前两名的记录
这类问题其实就是常见的:分组取每组最大值、最小值,每组最大的N条(top N)记录。
sql面试题:topN问题
工作中会经常遇到这样的业务问题:
如何找到每个类别下用户最喜欢的产品是哪个?
如果找到每个类别下用户点击最多的5个商品是什么?
这类问题其实就是常见的:分组取每组最大值、最小值,每组最大的N条(top N)记录。
面对该类问题,如何解决呢?
下面我们通过成绩表的例子来给出答案。
成绩表是学生的成绩,里面有学号(学生的学号),课程号(学生选修课程的课程号),成绩(学生选修该课程取得的成绩)
分组取每组最大值
案例:按课程号分组取成绩最大值所在行的数据
我们可以使用分组(group by)和汇总函数得到每个组里的一个值(最大值,最小值,平均值等)。但是无法得到成绩最大值所在行的数据。
select课程号, max(成绩) as最大成绩
fromscore
groupby课程号;
我们可以使用关联子查询来实现:
select*
fromscore asa
where成绩 = (
selectmax(成绩)
fromscore asb
whereb.课程号 = a.课程号);
上面查询结果课程号“0001”有2行数据,是因为最大成绩80有2个
分组取每组最小值
案例:按课程号分组取成绩最小值所在行的数据
同样的使用关联子查询来实现
select*
fromscore asa
where成绩 = (
selectmin(成绩)
fromscore asb
whereb.课程号 = a.课程号);
每组最大的N条记录
案例:查询各科成绩前两名的记录
第1步,查出有哪些组
我们可以按课程号分组,查询出有哪些组,对应这个问题里就是有哪些课程号
select课程号, max(成绩) as最大成绩
fromscore
groupby课程号;
第2步:先使用order by子句按成绩降序排序(desc),然后使用limt子句返回topN(对应这个问题返回的成绩前两名)
– 课程号’0001’ 这一组里成绩前2名
select*
fromscore
where课程号 = ‘0001’
orderby成绩 desc
limit2;
同样的,可以写出其他组的(其他课程号)取出成绩前2名的sql
第3步,使用union all 将每组选出的数据合并到一起
– 左右滑动可以可拿到全部sql
( select* fromscore where课程号 = '0001’orderby成绩 desclimit2)
unionall
( select* fromscore where课程号 = '0002’orderby成绩 desclimit2)
unionall
( select* fromscore where课程号 = '0003’orderby成绩 desclimit2);
前面我们使用order by子句按某个列降序排序(desc)得到的是每组最大的N个记录。如果想要达到每组最小的N个记录,将order by子句按某个列升序排序(asc)即可。
求topN的问题还可以使用自定义变量来实现,这个在后续再介绍。
如果对多表合并还不了解的,可以看下我讲过的《从零学会SQL》的“多表查询”。
总结
常见面试题:分组取每组最大值、最小值,每组最大的N条(top N)记录。
4.多表查询
查询所有学生的学号、姓名、选课数、总成绩
select a.学号,a.姓名, count(b.课程号) as选课数, sum(b.成绩) as总成绩
from student as a left join score as b
ona.学号 = b.学号
groupbya.学号;
查询平均成绩大于85的所有学生的学号、姓名和平均成绩
selecta.学号,a.姓名, avg(b.成绩) as平均成绩
fromstudent asa leftjoinscore asb
ona.学号 = b.学号
groupbya.学号
havingavg(b.成绩)> 85;
查询学生的选课情况:学号,姓名,课程号,课程名称
selecta.学号, a.姓名, c.课程号,c.课程名称
fromstudent a innerjoinscore b ona.学号=b.学号
innerjoincourse c onb.课程号=c.课程号;
查询出每门课程的及格人数和不及格人数
– 考察case表达式
select课程号,
sum( casewhen成绩>= 60then1
else0
end) as及格人数,
sum( casewhen成绩 < 60then1
else0
end) as不及格人数
fromscore
groupby课程号;
使用分段[100-85],[85-70],[70-60],[<60]来统计各科成绩,分别统计:各分数段人数,课程号和课程名称
– 考察case表达式
selecta.课程号,b.课程名称,
sum( casewhen成绩 between85and100
then1else0end) as’[100-85]',
sum( casewhen成绩 >= 70and成绩< 85
then1else0end) as’[85-70]',
sum( casewhen成绩>= 60and成绩< 70
then1else0end) as’[70-60]',
sum( casewhen成绩< 60then1else0end) as’[<60]’
fromscore asa rightjoincourse asb
ona.课程号=b.课程号
groupbya.课程号,b.课程名称;
查询课程编号为0003且课程成绩在80分以上的学生的学号和姓名|
selecta.学号,a.姓名
fromstudent asa innerjoinscore asb ona.学号=b.学号
whereb.课程号= '0003’andb.成绩> 80;
下面是学生的成绩表(表名score,列名:学号、课程号、成绩)
使用sql实现将该表行转列为下面的表结构
【面试题类型总结】这类题目属于行列如何互换,解题思路如下:
【面试题】下面是学生的成绩表(表名score,列名:学号、课程号、成绩)
使用sql实现将该表行转列为下面的表结构
【解答】
第1步,使用常量列输出目标表的结构
可以看到查询结果已经和目标表非常接近了
select学号, ‘课程号0001’, ‘课程号0002’, ‘课程号0003’
fromscore;
第2步,使用case表达式,替换常量列为对应的成绩
select学号,
( case课程号 when’0001’then成绩 else0end) as’课程号0001’,
( case课程号 when’0002’then成绩 else0end) as’课程号0002’,
( case课程号 when’0003’then成绩 else0end) as’课程号0003’
fromscore;
在这个查询结果中,每一行表示了某个学生某一门课程的成绩。比如第一行是’学号0001’选修’课程号00001’的成绩,而其他两列的’课程号0002’和’课程号0003’成绩为0。
每个学生选修某门课程的成绩在下图的每个方块内。我们可以通过分组,取出每门课程的成绩。
第3关,分组
分组,并使用最大值函数max取出上图每个方块里的最大值
select学号,
max( case课程号 when’0001’then成绩 else0end) as’课程号0001’,
max( case课程号 when’0002’then成绩 else0end) as’课程号0002’,
max( case课程号 when’0003’then成绩 else0end) as’课程号0003’
fromscore
groupby学号;
这样我们就得到了目标表(行列互换)
log.csdnimg.cn/direct/602cbac9ad8a452e86c94d017eca6707.jpeg)