今天回顾四大知识类型习题及面试题进行练习,最后针对提高SQL查询效率展开深入研究
使用软件:MYSQL & Navicate
一,简单查询练习
- 创建学校数据库的表
打开Navicate工具:点击数据库school 右键打开,呈现出彩色图案—> 右击表—>新建表—>输入列名—>类型 varchar(可变长度)—>长度20(最多为20位数)—>不是null打勾(此列不可为空)
student:
输入SQL语句 向表中插入数据
insert into student(学号,姓名,出生日期,性别)
values('0001','猴子','1989-01-01','男');
insert into student(学号,姓名,出生日期,性别)
values('0002','猴子','1990-12-21','女');
insert into student(学号,姓名,出生日期,性别)
values('0003','马云','1991-12-21','男');
insert into student(学号,姓名,出生日期,性别)
values('0004','王思聪','1990-05-20','男');
score:
输入SQL语句 向表中插入数据
insert into score(学号,课程号,成绩)
values('0001','0001','80');
insert into score(学号,课程号,成绩)
values('0001','0002','90');
insert into score(学号,课程号,成绩)
values('0001','0003','99');
insert into score(学号,课程号,成绩)
values('0002','0002','60');
insert into score(学号,课程号,成绩)
values('0002','0003','80');
insert into score(学号,课程号,成绩)
values('0003','0001','80');
insert into score(学号,课程号,成绩)
values('0003','0002','80');
insert into score(学号,课程号,成绩)
values('0003','0001','80');
接下来的课程表,教师表以此类推
课程表:
insert into score (课程号,课程名称,教师号) values ('0001','语文','0002');
insert into score (课程号,课程名称,教师号) values ('0002','数学','0001');
insert into score (课程号,课程名称,教师号) values ('0003','英语','0003');
教师表:
insert into teacher (教师号,教师姓名) values ('0001','孟扎扎');
insert into teacher (教师号,教师姓名) values ('0002','马化腾');
insert into teacher (教师号,教师姓名) values ('0003','Null');
insert into teacher (教师号,教师姓名) values ('0004','');
2.
查询姓猴的学生信息
select * from student where 姓名 like '猴%';
查询最后一个字是猴的学生信息
select * from student where 姓名 like '%猴';
查询名字中带猴字的学生信息
select * from student where 姓名 like '%猴%';
查询姓孟老师的个数
select count(教师号) from teacher where 教师姓名 like '孟%';
二,汇总分析
- 查询课程编号为0002的总成绩
select sum(成绩) from score where 课程号 = '0002';
2. 查询选了课程的学生人数
select count(distinct 学号) from score;
3. 查询各科成绩最高分最低分
select 课程号,max(成绩) as 最高分,min(成绩) as 最低分
from score
group by 课程号;
4.查询每门课程被选修的学生人数
select 课程号,count(学号) as 人数 from score
group by 课程号;
5. 查询男生,女生人数
select 性别,count(*) from student group by 性别;
6.查询平均成绩大于60分学生的学号和平均成绩
select 学号,avg(成绩) as 平均成绩
from score
group by 学号
having avg(成绩) > 60;
7. 查询至少选修两门课程的学生学号
select 学号,count(课程号) from score
group by 学号
having count(课程号) > 2;
8.查询同名同姓学生名单并统计同名人数
select 姓名,count(姓名)
from student
group by 姓名
having count(姓名) >2;
9. 查询不及格的课程并按课程号从大到小排列
select 课程号 from score where 成绩 < 60
order by 课程号 desc;
10. 查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列
select 课程号,avg(成绩) as 平均成绩
from score
group by 课程号
order by avg(平均成绩) asc,课程号 desc;
11.检索课程编号为0004且分数小于60的学生学号,结果按分数降序排列
select 学号 from score
where 课程号 = '0004' and 成绩 < 60
order by 成绩 desc;
12.统计每门课程的学生选修人数(超过2人的课程才统计)按人数降序,若排名相同 按课程号升序
select 课程号, count(课程号) as 选修人数
from score
group by 课程号
having count(课程号) >2
order by count(课程号) desc,课程号 asc;
三,复杂查询
1. 查询所有课程成绩小于60分学生的学号,姓名
select 学号,姓名 from student
where 学号 in(
select 学号 from score group by 课程号 having max(成绩) < 60);
2. 查询没有学全所有课的学生的学号,姓名
select 学号,姓名 from student
where 学号 in (
select 学号 from score group by 学号
having count(课程号) < (select count(课程号) from course));
3. 查询出只选修了两门课程的全部学生的学号和姓名
select 学号,姓名 from student
where 学号 in (
select 学号 from score group by 学号 having count(课程号) = 2);
4. 1990年出生的学生名单
select 学号,姓名 from student
where year(出生日期) = 1990;
面试题类型:topN 问题
这类问题常见分组取每组最大值,最小值,每组最大的N条记录
1. 分组取每组最大值
eg:按课程分组取成绩最大值所在行的数据
select * from score as a
where 成绩 = (
select max(成绩) from score as b where b.课程号 = a.课程号 group by 课程号);
2.分组取每类最小值
eg:按课程号分组取成绩最小值所在行的数据
select * from score as a
where 成绩 = (
select min(成绩) from score as b where b.课程号 = a.课程号 group by 课程号);
3.每组最大的N条记录
eg:查询各科成绩前两名的记录
select 课程号,max(成绩) as 最大成绩 from score group by 课程号;
4. 成绩按降序排列 使用前两排数据
eg:课程号0001这一组成绩前两名
select * from score
where 课程号 = '0001'
order by 成绩 desc limit 2;
5.将每一个课程的成绩前两名合并在一起
(select * from score
where 课程号 = '0001'
order by 成绩 desc limit 2)
union all
(select * from score
where 课程号 = '0002'
order by 成绩 desc limit 2)
union all
(select * from score
where 课程号 = '0003'
order by 成绩 desc limit 2);
四,多表查询
1 通过以下两个表 学生表以及近视学生表,查询出不是近视的学生
select 学号,学生姓名 from 学生表 as a
where 学号 not in (select 学号 from 近视学生表 as b where a.学号 = b.学号);
select a.学号,a.学生姓名
from 学生表 as a left join 近视学生表 as b on a.学号 = b.学号
where b.序号 is null;
解读:
先观察此题属于哪种联结
不是近视的学生数据 是学生表里有 近视学生表里没有的数据,所以可以判断出联结情况如下
这类联结的sql语句是:
select 列名 from student as a left join score as b on a.列名=b.列名
where b.列名 = Null;
2. 某网站包含两个表,顾客姓名表(customers)和购买记录表(orders)找出所有从不定任何东西的客户
select a.id,a.Name from Customers as a left join Orders as b on a.id = b.CustomerId
where b.id is null;
五,如何提高SQL查询的效率
问题1:
我们公司的数据量非常大,需要的不仅仅是提取数据,要了解SQL方案优化的。一般在写SQL时需要注意哪些问题,可以提高查询的效率?
答:
1. select 子句中尽量避免使用* ,因为*代表的是全部数据,在处理公司数据的时候要处理动辄十万,百万,千万的数据
这个时候再用* 会多消耗几分钟的时间。其次如果select * 用于多表联结会造成更大的成本开销
2.where子句比较符号的左边 尽量避免使用函数
如果where子句的左边出现表达式或函数 会导致数据库引擎进行全表扫描 从而增加运行时间
优化方案:为了提高效率,where子句中的函数或表达式尽量放在比较符右侧
比如在成绩表中给每个人加5分, ’成绩在90分以上‘的条件查询
where 成绩 + 5 >90
优化方案:
where 成绩 > 90 -5
3.尽量避免使用in 和 not in
in 和 not in会导致数据库进行全表搜索 增加运行时间
比如 查询第8,9个人的学号和成绩
select 学号,成绩 from score where 学号 in(8,9);
优化方案如下:
select 学号,成绩 from score where 学号 between 8 and 9;
4.尽量避免使用or
or 同样会导致数据库引擎的全表搜索
比如:从成绩表中选出成绩是88分或者89分学生的学号
select 学号 from score where 成绩 = 88 or 成绩 = 89;
优化方案如下
select 学号 from score where 成绩 = 88
union
select 学号 from score where 成绩 = 88
虽然语句变长,但处理大量数据时,可以省下很对时间
5. 使用limit子句限制返回的数据行数
如果前台只需要是多行的数据,不使用limit限制行数会返回上万行的情况下应使用limit限制返回行数