- 学习:知识的初次邂逅
- 复习:知识的温故知新
- 练习:知识的实践应用
一,原题力扣链接
二,题干
院系表:
Departments
+---------------+---------+ | Column Name | Type | +---------------+---------+ | id | int | | name | varchar | +---------------+---------+ 在 SQL 中,id 是该表的主键 该表包含一所大学每个院系的 id 信息学生表:
Students
+---------------+---------+ | Column Name | Type | +---------------+---------+ | id | int | | name | varchar | | department_id | int | +---------------+---------+ 在 SQL 中,id 是该表的主键 该表包含一所大学每个学生的 id 和他/她就读的院系信息找出那些所在院系不存在的学生的 id 和姓名
可以以 任何顺序 返回结果。
下面是返回结果格式的例子。
示例 1:
输入: Departments 表: +------+--------------------------+ | id | name | +------+--------------------------+ | 1 | Electrical Engineering | | 7 | Computer Engineering | | 13 | Bussiness Administration | +------+--------------------------+ Students 表: +------+----------+---------------+ | id | name | department_id | +------+----------+---------------+ | 23 | Alice | 1 | | 1 | Bob | 7 | | 5 | Jennifer | 13 | | 2 | John | 14 | | 4 | Jasmine | 77 | | 3 | Steve | 74 | | 6 | Luis | 1 | | 8 | Jonathan | 7 | | 7 | Daiana | 33 | | 11 | Madelynn | 1 | +------+----------+---------------+ 输出: +------+----------+ | id | name | +------+----------+ | 2 | John | | 7 | Daiana | | 4 | Jasmine | | 3 | Steve | +------+----------+ 解释: John, Daiana, Steve 和 Jasmine 所在的院系分别是 14, 33, 74 和 77, 其中 14, 33, 74 和 77 并不存在于院系表
三,建表语句
import pandas as pd
data = [[1, 'Electrical Engineering'], [7, 'Computer Engineering'], [13, 'Bussiness Administration']]
departments = pd.DataFrame(data, columns=['id', 'name']).astype({'id':'Int64', 'name':'object'})
data = [[23, 'Alice', 1], [1, 'Bob', 7], [5, 'Jennifer', 13], [2, 'John', 14], [4, 'Jasmine', 77], [3, 'Steve', 74], [6, 'Luis', 1], [8, 'Jonathan', 7], [7, 'Daiana', 33], [11, 'Madelynn', 1]]
students = pd.DataFrame(data, columns=['id', 'name', 'department_id']).astype({'id':'Int64', 'name':'object', 'department_id':'Int64'})
四,分析
第一步: 为左连接做准备,先改名:
departments.rename(columns={'id':'department_id'},inplace=True) #修改列名
df = pd.merge(students,departments,how='left',on='department_id') #左连接
第二步:保留是NAN的行
最后改名已符合题目最终的查询效果
五,Pandas解答
import pandas as pd
def find_students(departments: pd.DataFrame, students: pd.DataFrame) -> pd.DataFrame:
departments.rename(columns={'id':'department_id'},inplace=True) #修改列名
df = pd.merge(students,departments,how='left',on='department_id') #左连接
df1 = df[df['name_y'].isnull()] #保留name是null值的
df2 = df1[['id','name_x']]
df2.rename(columns={'name_x':'name'},inplace=True)
return df2
六,验证
七,知识点总结
- Pandas修改列名的运用 API:rename
- Pandas左连接的运用 API:merge
- Pandas保留空值的运用 API:isnull()
- ptyhon函数的运用
- 学习:知识的初次邂逅
- 复习:知识的温故知新
- 练习:知识的实践应用