该题目来源于力扣:
题目要求:
表: Employees
+-------------+---------+
| 列名 | 类型 |
+-------------+---------+
| employee_id | int |
| name | varchar |
| salary | int |
+-------------+---------+
employee_id 是这个表的主键(具有唯一值的列)。
此表的每一行给出了雇员id ,名字和薪水。
编写解决方案,计算每个雇员的奖金。如果一个雇员的 id 是 奇数 并且他的名字不是以 'M' 开头,那么他的奖金是他工资的 100% ,否则奖金为 0 。
返回的结果按照 employee_id 排序。
返回结果格式如下面的例子所示。
示例 1:
输入:
Employees 表:
+-------------+---------+--------+
| employee_id | name | salary |
+-------------+---------+--------+
| 2 | Meir | 3000 |
| 3 | Michael | 3800 |
| 7 | Addilyn | 7400 |
| 8 | Juan | 6100 |
| 9 | Kannon | 7700 |
+-------------+---------+--------+
输出:
+-------------+-------+
| employee_id | bonus |
+-------------+-------+
| 2 | 0 |
| 3 | 0 |
| 7 | 7400 |
| 8 | 0 |
| 9 | 7700 |
+-------------+-------+
解释:
因为雇员id是偶数,所以雇员id 是2和8的两个雇员得到的奖金是0。
雇员id为3的因为他的名字以'M'开头,所以,奖金是0。
其他的雇员得到了百分之百的奖金。
特殊函数介绍:
-loc查询函数语法:
数据集.loc[查询条件,指定列]
查询条件和指定列可以是多个,其中查询条件中不可以使用and和or等形式的逻辑符号,因为这种类型的符号在python中有明确的优先级,在这里容易造成语法混乱,我们可以使用 &、| 等符号进行逻辑判断。在切片查询和query函数中同理
思路流程:
首先这里有两个条件,呈现“或”的条件,我们可以用"|"来表示,其次,查询出的结果要求在工资列进行修改,所以我们在loc的第二个元素指定列就是salary
代码实现:
import pandas as pd
def calculate_special_bonus(employees: pd.DataFrame) -> pd.DataFrame:
employees.loc[(employees['employee_id'] % 2 == 0) | (employees['name'].str.findall("^M")),'salary']=0
return employees[['employee_id','salary']].rename(columns={'salary':'bonus'}).sort_values('employee_id')