一、分组查询
(一)格式
SELECT 分组函数,字段(要求是出现在GROUP BY后面的字段)
FROM 表
【WHERE 筛选条件】
GROUP BY 分组的列表
【ORDER BY 子句】
(二)简单的分组查询
案例1:查询每个工种的最高工资
SELECT MAX(salary),job_id
FROM employees
GROUP BY job_id;
案例2:查询每个位置上的部门个数
SELECT COUNT(*),location_id
FROM departments
GROUP BY location_id;
(三)添加分组前筛选条件的分组查询
案例1:查询每个部门邮箱中包含a字符的员工的平均工资
SELECT AVG(salary),department_id
FROM employees
WHERE email LIKE '%a%'
GROUP BY department_id;
案例2:查询每个领导手下有奖金的员工的最高工资
SELECT MAX(salary),manager_id
FROM employees
WHERE commission_pct IS NOT NULL
GROUP BY manager_id;
(四)添加分组后筛选条件的分组查询
案例1:查询哪个部门的员工个数>2
#1.先查询每个部门的员工个数
SELECT COUNT(*),department_id
FROM employees
GROUP BY department_id;
#2.根据1的结果进行筛选,查询哪个部门的员工个数>2
SELECT COUNT(*),department_id
FROM employees
GROUP BY department_id
HAVING COUNT(*)>2;
案例2:查询每个工种有奖金的员工的最高工资>12000的工种编号和其最高工资
#1.先查询每个工种有奖金的员工的最高工资
SELECT MAX(salary),job_id
FROM employees
WHERE commission_pct IS NOT NULL
GROUP BY job_id;
#2.根据1的结果继续筛选,最高工资>12000
SELECT MAX(salary),job_id
FROM employees
WHERE commission_pct IS NOT NULL
GROUP BY job_id
HAVING MAX(salary)>12000;
案例3:查询领导编号>102的每个领导手下的员工的最低工资>5000的领导编号是哪个,以及其最低工资
#1,查询每个领导手下的员工的固定最低工资
SELECT MIN(salary),manager_id
FROM employees
GROUP BY manager_id;
#2.添加分组前筛选条件:编号>102
SELECT MIN(salary),manager_id
FROM employees
WHERE manager_id>102
GROUP BY manager_id;
#3.添加分组后筛选条件:最低工资>5000
SELECT MIN(salary),manager_id
FROM employees
WHERE manager_id>102
GROUP BY manager_id
HAVING MIN(salary)>5000;
小结
分组查询中的筛选条件分为两类:
数据源 | 位置 | 关键字 | |
---|---|---|---|
分组前筛选条件 | 原始表 | GROUP BY 子句的前面 | WHERE |
分组后筛选条件 | 分组后的结果集 | GROUP BY子句的后面 | HAVING |
①分组函数做条件肯定是放在HAVING子句中
②能用分组前筛选的,就优先考虑分组前筛选
(五)按表达式或函数分组查询
案例:按员工姓名长度分组,查询每一组的员工个数,筛选员工个数>5的有哪些
#1.查询每个姓名长度的员工个数
SELECT COUNT(*) LENGTH(last_name)
FROM employees
GROUP BY LENGTH(last_name);
#2.添加筛选条件
SELECT COUNT(*) LENGTH(last_name)
FROM employees
GROUP BY LENGTH(last_name)
Having COUNT(*)>5;
当然,也可以起别名,并用别名进行分组查询:
SELECT COUNT(*) c,LENGTH(last_name) len_name
FROM employees
GROUP BY len_name
Having c>5;
(六)按多个字段分组查询
GROUP BY可以支持单个字段分组查询,也支持多个字段分组查询(多个字段之间用逗号隔开,没有顺序要求)
案例:查询每个部门每个工种的员工的平均工资
SELECT AVG(salary),department_id,job_id
FROM employees
GROUP BY department_id,job_id;
(七)添加排序的分组查询
案例:查询每个部门每个工种的员工的平均工资,并且按平均工资从高到低显示
SELECT AVG(salary),department_id,job_id
FROM employees
GROUP BY department_id,job_id
ORDER BY AVG(salary) DESC;
SQL语句的执行顺序:
SELECT 分组函数,分组后的字段 #5
FROM 表 #1
【WHERE 筛选条件】#2
GROUP BY 分组的字段 #3
【HAVING 分组后的筛选】 #4
【ORDER BY 排序列表】 #6
练习题1:查询各个领导手下员工的最低工资,其中最低工资不能低于6000,没有领导的员工不计算在内
SELECT MIN(salary),manager_id
FROM employees
WHERE manager_id IS NOT NULL
GROUP BY manager_id
HAVING MIN(salary)>=6000;
练习题2:查询各个工种的员工个数
SELECT COUNT(*) 个数,job_id
FROM employees
GROUP BY job_id;
二、连接查询
又称多表查询,当查询的字段来自于多个表时,就会用到连接查询
(一)笛卡尔乘积现象
笛卡尔乘积现象:表1有m行,表2有n行,结果=m*n行
案例:查询员工的姓和其对应的部门名
如果这样进行多表查询会出现笛卡尔乘积现象:
SELECT last_name,department_name
FROM employees,departments
员工表共有107行,部门表有27行,而上面这个查询的结果有2889行
发生原因:没有有效的连接条件
如何避免:添加有效的连接条件
SELECT last_name,department_name
FROM employees,departments
WHERE employees.department_id=departments.department_id;#连接条件
(二)分类
- 按年代分类:
- sql92标准:仅仅支持内连接
- sql99标准(推荐):支持内连接+外连接(左外和右外)+交叉连接
- 按功能分类:
- 内连接:
- 等值连接
- 非等值连接
- 自连接
- 外连接:
- 左外连接
- 右外连接
- 全外连接(MySQL不支持,其他数据库支持,如Oracle)
- 交叉连接
- 内连接:
(三)sql92标准(仅仅支持内连接)
1. 等值连接
①多表等值连接的结果为多表的交集部分
②n表连接,至少需要n-1个连接条件
③多表的顺序没有要求
④一般需要为表起别名
⑤可以搭配前面介绍的所有子句使用,比如排序、分组、筛选
(1)起别名的等值连接查询
在多表查询中,多个表中可能有同名的字段,因此我们就需要在SELECT后边的字段标明是查询哪个表的该字段,当然我们也可以给表起别名。
作用:
①提高语句的简洁度
②区分多个重名的字段
注意:如果给表起了别名,则查询的字段就不能使用原来的表名去限定
案例:查询员工名、工种号、工种名
SELECT last_name,e.job_id,job_title #此处起了别名,就不能用employee.job_id
FROM employees e,jobs j #两个表的顺序可以调换
WHERE e.job_id=j.job_id;
(2)添加筛选条件的等值连接查询
由于连接查询需要有连接条件,而连接条件是写在WHERE关键字后的,而我们知道筛选条件也是写在WHERE后的,如果此时还有筛选条件,那么就要用到AND关键字,连在WHERE后。
案例1:查询有奖金的员工名和所在部门名
SELECT last_name,department_name
FROM employee e,departments d
WHERE e.department_id=d.department_id
AND e.commission_pct IS NOT NULL;
案例2:查询城市名中第二个字符为o的部门名和城市名
SELECT department_name,city
FROM departments d,locations l
WHERE d.location_id=l.location_id
AND city LIKE '_o%';
(3)添加分组的等值连接查询
案例:查询每个城市的部门个数,并按城市名排序
SELECT COUNT(*) 个数,city
FROM departments d,locations l
WHERE d.location_id=l.location_id
GROUP BY city;
(4)添加排序的等值连接查询
案例:查询每个工种的工种名和员工的个数,并且按员工个数降序
SELECT job_title,COUNT(*)
FROM employees e,jobs j
WHERE e.job_id=j.job_id
GROUP BY job_title
ORDER BY COUNT(*) DESC;
(5)三表连接的等值连接查询
案例:查询在第一个字母为s的城市工作的所有员工的姓和所在部门名,并按部门名降序排序
SELECT last_name,department_name,city
FROM employees e,departments d,locations l
WHERE e.department_id=d.department_id
AND d.location_id=l.location_id
AND city LIKE 's%'
ORDER BY department_name DESC;
2. 非等值连接
案例:查询员工的工资和工资级别
已知有一张工资级别的表job_grades:
SELECT salary,grade_level
FROM employees e,job_grades g
WHERE salary BETWEEN g.lowest_sal AND g.highest_sal;
3. 自连接
同一张表当两张来用,自己连接自己
案例:查询员工名和上级的名称
SELECT e.employee_id,e.last_name,m.employee_id,m.last_name
FROM employees e,employees m
WHERE e.manager_id=m.employee_id;
练习题:查询每个国家下的部门个数大于2的国家编号
SELECT country_id,COUNT(*) 部门个数
FROM departments d,locations l
WHERE d.location_id=l.location_id
GROUP BY country_id
HAVING 部门个数>2;
(四)sql99标准
格式:
SELECT 查询列表
FROM 表1 别名
【连接类型】JOIN 表2 别名
ON 连接条件
【WHERE 筛选条件】
【GROUP BY 分组】
【HAVING 分组之后的筛选条件】
【ORDER BY 排序列表】
连接类型 | 关键字 |
---|---|
内连接 | INNER |
左外连接 | LEFT【OUTER】 |
右外连接 | RIGHT【OUTER】 |
全外连接 | FULL【OUTER】 |
交叉连接 | CROSS |
1. 内连接
格式:
SELECT 查询列表
FROM 表1 别名
【INNER】 JOIN 表2 别名
ON 连接条件;
特点:
①同样可以添加筛选条件、分组、排序
②INNER可以省略
③筛选条件放在WHERE后面,连接条件放在ON后面,提高分离性,便于阅读
④sql99标准中的等值连接和sql92标准中的等值连接效果是一样的,都是查询多表的交集
(1)等值连接
①普通等值连接查询
案例:查询员工名、部门名
SELECT last_name,department_name
FROM employees e
INNER JOIN departments d
ON e.department_id=d.department_id;
②添加筛选条件的等值连接查询
案例:查询名字中包含e的员工名和其工种名
SELECT last_name,job_title
FROM employees e
INNER JOIN jobs j
ON e.job_id=j.job_id
WHERE e.last_name LIKE '%e%';
③添加分组的等值连接查询
案例:查询部门个数>3的城市名和部门个数
#1.查询每个城市的部门个数
SELECT city,COUNT(*) 部门个数
FROM departments d
INNER JOIN locations l
ON d.locaton_id=l.location_id
GROUP BY city
#2.在1结果上筛选满足条件的
HAVING COUNT(*)>3;
④添加排序的等值连接查询
案例:查询员工个数>3的部门名和员工个数,并按个数排序
#1.查询每个部门的员工个数
SELECT COUNT(*),department_name
FROM employees e
INNER JOIN departments d
ON e.department_id=d.department_id
GROUP BY department_name
#在1结果上筛选员工个数>3的记录,并排序
HAVING COUNT(*) >3
ORDER BY COUNT(*) DESC;
⑤三表连接的等值连接查询
案例:查询员工名和对应部门名、工种名,并按部门名降序排序
SELECT last_name,department_name,job_title
FROM employees e
INNER JOIN departments d ON e.department_id=d.department_id
INNER JOIN jobs j ON e.job_id=j.job_id
ORDER BY department_name DESC;
(2)非等值连接
案例:查询员工个数>20的工资级别,并且按工资级别降序排序
SELECT COUNT(*) 员工个数,grade_level
FROM employees e
INNER JOIN job_grades g
ON e.salary BETWEEN g.lowest_sal AND g.highest_sal
GROUP BY grade_level
HAVING COUNT(*)>20
ORDER BY grade_level DESC;
(3)自连接
案例:查询姓名中包含字符k的员工的名字、上级的名字
SELECT e.last_name,m.last_name
FROM employees e
INNER JOIN employees m
ON e.manager_id=m.employee_id
WHERE e.last_name LIKE '%k%';
2.外连接
应用场景:用于查询一个表中有,另一个表没有的记录
特点:
- 外连接查询结果=内连接查询结果+主表中有而从表中没有的记录
外连接的查询结果为主表中的所有记录,如果从表中有和它匹配的,则显示匹配的值;如果从表中没有和它匹配的,则显示null - 左外连接,LEFT JOIN左边的是主表
右外连接,RIGHT JOIN右边的是主表 - 左外和右外其实就是交换两个表的顺序,它们可以实现同样的效果
(1)左外连接
案例:查询哪个部门没有员工
由于员工可能没有,那么员工表是子表,部门表是主表
SELECT d.*,e.employee_id
FROM departments d
LEFT OUTER JOIN employees e
ON d.department_id=e.department_id
WHERE e.employee_id IS NULL;
(2)右外连接
其实就是左外连接调换一下顺序
案例:查询哪个部门没有员工
SELECT d.*,e.employee_id
FROM employees e
LEFT OUTER JOIN departments d
ON d.department_id=e.department_id
WHERE e.employee_id IS NULL;
(3)全外连接
全外连接=内连接的结果+表1中有但表2中没有的+表2中有但表1中没有的
MySQL不支持全外连接
SELECT d.*,e.employee_id
FROM departments d
FULL OUTER JOIN employees e
ON d.department_id=e.department_id;
3.交叉连接
其实结果就是笛卡尔乘积
SELECT last_name,department_name
FROM employees
CROSS JOIN departments;
练习题1:查询哪个城市没有部门(要求右外连接)
SELECT city
FROM departments d
RIGHT OUTER JOIN locations l
ON d.location_id=l.location_id
WHERE d.department_id IS NULL;
练习题2:查询部门名为SAL或IT的员工信息
SELECT e.*,d.department_name,d.department_id
FROM departments d
LEFT JOIN employees e
ON d.department_id=e.department_id
WHERE d.department_name IN('SAL','IT');
练习题3:查询没有员工的部门个数
SELECT COUNT(*)
FROM departments d
LEFT JOIN employees e
ON d.department_id=e.department_id
WHERE e.employee_id IS NULL;
4.总结