题目描述:MySQL查询部门工资最高的员工
Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。
Department 表包含公司所有部门的信息。
题目要求
编写一个 SQL 查询,找出每个部门工资最高的员工。
例如,根据上述给定的表格,Max 在 IT 部门有最高工资,Henry 在 Sales 部门有最高工资。
解题思路
作为一名小菜鸡,我刚开始是这样写的
select Department.name as Department,
Employee.name as Employee,
max(Salary) as Salary
from Department
inner join Employee
on Employee.DepartmentId=Department.Id
group by Employee.DepartmentId;
程序也可以运行,下图为运行结果,但是并不是预期结果。
这是为什么呢?
因为上条SQL的执行顺序:
先执行from,完成Department和Employee两个表内联结;
再执行group by,数据按照Employee.DepartmentId进行分组。group by 只会返回默认排序中的第一行数据
然后执行select,此时的聚合函数max(Salary)是每组DepartmentId中的Salary最大值,且此时查找的Employee.name与max(Salary)并没有关系。
注意:group by函数的坑
group by 只会返回默认排序中的第一行数据。
下面用一个小例子解释这句话
例如:查询Employee表中每个部门的id,name
若使用group by函数分组查询,代码如下
select id,name
from Employee
group by DepartmentId;
查询结果为
而实际上表Employee中DepartmentId=1的id有两个,查询结果却只显示了一个。这正是因为group by 只会返回默认排序中的第一行数据。
所以这里不能使用group by解决。
修改思路:
- 先查询每个部门内最高工资
select DepartmentId,max(Salary)
from Employee
group by DepartmentId;
- 再使用内联结把表 Employee 和 Department 连接,再在这张临时表里用 IN 语句查询部门名字和工资的关系。
select Department.name as Department,
Employee.name as Employee,
Salary
from Department
inner join Employee
on Employee.DepartmentId=Department.Id
where (Employee.DepartmentId,Salary) in #两个字段的IN操作
(select DepartmentId,max(Salary)
from Employee
group by DepartmentId);