每日一题26：数据操作之部门工资最高的员工

最新推荐文章于 2024-09-17 23:15:58 发布

锂享生活

最新推荐文章于 2024-09-17 23:15:58 发布

阅读量550

点赞数 10

分类专栏：每日一题文章标签： python

本文链接：https://blog.csdn.net/m0_63227758/article/details/139282896

版权

每日一题专栏收录该内容

45 篇文章 1 订阅

订阅专栏

一、每日一题

表： Employee

+--------------+---------+
| 列名          | 类型    |
+--------------+---------+
| id           | int     |
| name         | varchar |
| salary       | int     |
| departmentId | int     |
+--------------+---------+
在 SQL 中，id是此表的主键。
departmentId 是 Department 表中 id 的外键（在 Pandas 中称为 join key）。
此表的每一行都表示员工的 id、姓名和工资。它还包含他们所在部门的 id。

表： Department

+-------------+---------+
| 列名         | 类型    |
+-------------+---------+
| id          | int     |
| name        | varchar |
+-------------+---------+
在 SQL 中，id 是此表的主键列。
此表的每一行都表示一个部门的 id 及其名称。

查找出每个部门中薪资最高的员工。
按 任意顺序 返回结果表。
查询结果格式如下例所示。

示例 1:

输入：
Employee 表:
+----+-------+--------+--------------+
| id | name  | salary | departmentId |
+----+-------+--------+--------------+
| 1  | Joe   | 70000  | 1            |
| 2  | Jim   | 90000  | 1            |
| 3  | Henry | 80000  | 2            |
| 4  | Sam   | 60000  | 2            |
| 5  | Max   | 90000  | 1            |
+----+-------+--------+--------------+
Department 表:
+----+-------+
| id | name  |
+----+-------+
| 1  | IT    |
| 2  | Sales |
+----+-------+
输出：
+------------+----------+--------+
| Department | Employee | Salary |
+------------+----------+--------+
| IT         | Jim      | 90000  |
| Sales      | Henry    | 80000  |
| IT         | Max      | 90000  |
+------------+----------+--------+
解释：Max 和 Jim 在 IT 部门的工资都是最高的，Henry 在销售部的工资最高。

解答：

import pandas as pd


def department_highest_salary(employee: pd.DataFrame, department: pd.DataFrame) -> pd.DataFrame:
    #获取每个部门的最高薪资
    max_salary_per_department = employee.groupby('departmentId')['salary'].max().reset_index()
    max_salary_per_department.rename(columns = {'salary': 'max_salary'}, inplace = True)

    # 将最高薪资与员工表合并，得到每个部门中薪资最高的员工
    merged_df = pd.merge(employee, max_salary_per_department, how='inner',
                         left_on=['departmentId', 'salary'],
                         right_on=['departmentId', 'max_salary'])

    # 将结果与部门表合并以获取部门名称
    final_result = pd.merge(merged_df, department, how = 'inner', left_on = 'departmentId', right_on = 'id')
    # 选择需要的列并重命名
    final_result = final_result[['name_y', 'name_x', 'salary']]

    final_result.columns = ['Department', 'Employee', 'Salary']

    return final_result


# 显示数据
employee_data = {
    'id':[1, 2, 3, 4, 5],
    'name':['Joe', 'Jim', 'Henry', 'Sam', 'Max'],
    'salary':[70000, 90000, 80000, 60000, 90000],
    'departmentId':[1, 1, 2, 2, 1]
}

department_data = {
    'id':[1, 2],
    'name':['IT', 'Sales']
}

# 创建 DataFrame
employee_df = pd.DataFrame(employee_data)
department_df = pd.DataFrame(department_data)

# 获取每个部门中薪资最高的员工
result = department_highest_salary(employee_df, department_df)
print(result)

题源：Leetcode