7 连接查询
7.1 distinct去除重复
注意:原表数据不会被修改,只是查询结果去重。
去重需要使用一个关键字:distinct
mysql> select distinct job from emp;
distinct只能出现在所有字段的最前方。
mysql> select ename,distinct job from emp;
-- 语法错误
联合去重
-- distinct出现在job,deptno两个字段之前,表示两个字段联合起来去重。
mysql> select distinct job,deptno from emp;
统计一下工作岗位的数量?
select count(distinct job) from emp; -- 去重后用分组函数
7.2 连接查询概念
7.2.1 什么是连接查询?
从一张表中单独查询,称为单表查询。
emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。
这种跨表查询,多张表联合起来查询数据,被称为连接查询。
7.2.2 连接查询的分类?
根据语法的年代分类:
SQL92:1992年的时候出现的语法
SQL99:1999年的时候出现的语法
我们这里重点学习SQL99.(这个过程中简单演示一个SQL92的例子)
根据表连接的方式分类:
内连接:
等值连接
非等值连接
自连接
外连接:
左外连接(左连接)
右外连接(右连接)
全连接(不讲)
7.2.3 笛卡尔积现象
什么是笛卡尔积现象
当两张表进行连接查询时,没有任何条件的限制会发生笛卡尔积现象。
当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,这是一个数学现象。)
如若A表10条数据,B表7条数据,A与B进行连接查询后,查得70条数据。
如何避免笛卡尔积现象
连接时加条件,满足这个条件的记录被筛选出来!
--——————————--——————————--——————————
select
ename,dname
from
emp, dept
where
emp.deptno = dept.deptno;
————————————--——————————--——————————
select
emp.ename,dept.dname
from
emp, dept
where
emp.deptno = dept.deptno;
--——————————--——————————--——————————
-- 表起别名。很重要。效率问题。
select
e.ename,d.dname
from
emp e, dept d
where
e.deptno = d.deptno; //SQL92语法。
思考:最终查询的结果条数是14条,但是匹配的过程中,匹配的次数减少了吗?
还是56次,只不过进行了四选一。次数没有减少。
注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量避免表的连接次数。
7.3 内连接
7.3.1 内连接之等值连接
案例:查询每个员工所在部门名称,显示员工名和部门名?
emp e和dept d表进行连接。条件是:e.deptno = d.deptno
-- SQL92语法:
select
e.ename,d.dname
from
emp e, dept d
where
e.deptno = d.deptno;
-- SQL99语法:
select
e.ename,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
sql92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。
sql99的优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后继续添加where。
join前面可以加inner,inner可以省略(带着inner可读性更好!!!一眼就能看出来是内连接)
总结sql99语法:
select
...
from
a
join
b
on
a和b的连接条件
where
筛选条件
7.3.2 内连接之非等值连接
案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?
薪资等级用到了区间函数。连接条件不是一个等量关系。
select
e.ename, e.sal, s.grade
from
emp e
inner join
salgrade s
on
e.sal between s.losal and s.hisal;
7.3.3 内连接之自连接
案例:查询员工的上级领导,要求显示员工名和对应的领导名?
在同一张表上,自己和自己连接查询。
技巧:一张表看成两张表。
select
a.ename as '员工名', b.ename as '领导名'
from
emp a
join
emp b
on
a.mgr = b.empno; //员工的领导编号 = 领导的员工编号
但是因为是内连接,所以如果一条记录的连接条件有NULL值的话,则不会查询出来。
以上就是内连接中的:自连接,技巧:一张表看做两张表。
7.4 外连接
内连接的特点:(A和B连接,AB两张表没有主次关系。平等的。)
select
e.ename,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno; -- 内连接的特点:完成能够匹配上这个条件的数据查询出来。
外连接(右外连接):
-- 示例
select
e.ename,d.dname
from
emp e
right join -- right后面可以加outer,它是可以省略的,带着可读性强。
dept d
on
e.deptno = d.deptno;
right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。
在外连接当中,两张表连接,产生了主次关系。
外连接(左外连接):
select
e.ename,d.dname
from
dept d
left join -- left后面可以加outer,它是可以省略的,带着可读性强。
emp e
on
e.deptno = d.deptno;
带有right的是右外连接,又叫做右连接。
带有left的是左外连接,又叫做左连接。
任何一个右连接都有左连接的写法。
任何一个左连接都有右连接的写法。
思考:外连接的查询结果条数一定是 >= 内连接的查询结果条数?
正确。
-- 案例:查询每个员工的上级领导,要求显示所有员工的名字和领导名?
select
a.ename as '员工名', b.ename as '领导名'
from
emp a
left join
emp b
on
a.mgr = b.empno;
多表连接:
语法:
select
...
from
a
join
b
on
a和b的连接条件
join
c
on
a和c的连接条件
right join
d
on
a和d的连接条件
-- 一条SQL中内连接和外连接可以混合。都可以出现!
案例:找出每个员工的部门名称以及工资等级,要求显示员工名、部门名、薪资、薪资等级?
select
e.ename,e.sal,d.dname,s.grade
from
emp e
join
dept d
on
e.deptno = d.deptno
join
salgrade s
on
e.sal between s.losal and s.hisal;
案例:找出每个员工的部门名称以及工资等级,还有上级领导,要求显示员工名、领导名、部门名、薪资、薪资等级?
select
e.ename,e.sal,d.dname,s.grade,l.ename
from
emp e
join
dept d
on
e.deptno = d.deptno
join
salgrade s
on
e.sal between s.losal and s.hisal
left join
emp l
on
e.mgr = l.empno;
8 子查询与分页操作
8.1 子查询概念
8.1.1 子查询概念
什么是子查询?
select语句中嵌套select语句,被嵌套的select语句称为子查询。
子查询都可以出现在哪里呢?
select
..(select).
from
..(select).
where
..(select).
8.1.2 where子句中的子查询
案例:找出比最低工资高的员工姓名和工资?
错误示例
select
ename,sal
from
emp
where
sal > min(sal);
-- 错误:where语句中不能用分组函数
正确示例
select
ename,sal
from
emp
where
sal > (select min(sal) from emp);
8.1.3 from子句中的子查询
注意:from后面的子查询,可以将子查询的查询结果当做一张临时表。(技巧)
案例:找出每个岗位的平均工资的薪资等级。
第一步:找出每个岗位的平均工资(按照岗位分组求平均值)
select job,avg(sal) from emp group by job;
第二步:克服心理障碍,把以上的查询结果就当做一张真实存在的表t。
select * from salgrade; -- s表
t表和s表进行表连接,条件:t.avg(sal) between s.losal and s.hisal;
select
t.*, s.grade
from
(select job,avg(sal) as avgsal from emp group by job) t
join
salgrade s
on
t.avgsal between s.losal and s.hisal;
8.1.4 select后面出现的子查询
这个内容不需要掌握,了解即可!
案例:找出每个员工的部门名称,要求显示员工名,部门名?
select
e.ename,e.deptno,(select d.dname from dept d where e.deptno = d.deptno) as dname
from
emp e;
注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果,多于1条,就报错了!如下:
-- 错误:ERROR 1242 (21000): Subquery returns more than 1 row
select
e.ename,e.deptno,(select dname from dept) as dname
from
emp e;
8.2 union合并查询结果集
案例:查询工作岗位是MANAGER和SALESMAN的员工?
-- 方法一:采用or或者in
select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';
select ename,job from emp where job in('MANAGER','SALESMAN');
-- 方法二:采用union
select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';
union的效率要高一些。对于表连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍的翻。
但是union可以减少匹配的次数。在减少匹配次数的情况下,还可以完成两个结果集的拼接。
a 连接 b 连接 c:
a 10条记录
b 10条记录
c 10条记录
匹配次数是:1000
采用union:
a 连接 b一个结果:10 * 10 --> 100次
a 连接 c一个结果:10 * 10 --> 100次
使用union的话是:100次 + 100次 = 200次。(union把乘法变成了加法运算)
union在使用的时候有注意事项吗?
-- 错误1:union在进行结果集合并的时候,要求两个结果集的列数相同。
select ename,job from emp where job = 'MANAGER'
union
select ename from emp where job = 'SALESMAN';
-- 错误2:结果集合并时列和列的数据类型也要一致。
-- MYSQL可以,oracle语法严格,不可以,报错。
select ename,job from emp where job = 'MANAGER'
union
select ename,sal from emp where job = 'SALESMAN';
8.3 limit分页操作
8.3.1 limit如何使用
完整用法:limit startIndex, length
startIndex是起始下标,length是长度。起始下标从0开始。
缺省用法:limit 5; 这是取前5。
按照薪资降序,取出排名在前5名的员工?
select
ename,sal
from
emp
order by
sal desc
limit 5; -- 默认从0开始,即取前5
select
ename,sal
from
emp
order by
sal desc
limit 0,5;
注意:mysql当中limit在order by之后执行
取出工资排名在[3-5]名的员工?
select
ename,sal
from
emp
order by
sal desc
limit
2, 3;
2表示起始位置从下标2开始,就是第三条记录。3表示长度。
取出工资排名在[5-9]名的员工?
select
ename,sal
from
emp
order by
sal desc
limit
4, 5;
8.3.2 分页操作
每页显示3条记录
第1页:limit 0,3 [0 1 2]
第2页:limit 3,3 [3 4 5]
第3页:limit 6,3 [6 7 8]
第4页:limit 9,3 [9 10 11]
每页显示pageSize条记录,第pageNo页,有公式:
l
i
m
i
t
(
p
a
g
e
N
o
−
1
)
∗
p
a
g
e
S
i
z
e
,
p
a
g
e
S
i
z
e
limit \ (pageNo-1)*pageSize , pageSize
limit (pageNo−1)∗pageSize,pageSize
8.4 关于DQL语句的大总结
select
...
from
...
where
...
group by
...
having
...
order by
...
limit
...
执行顺序:
1.from
2.where
3.group by
4.having
5.select
6.order by
7.limit…