23,Python数分之Pandas训练,力扣,580. 统计各专业学生人数

  • 学习:知识的初次邂逅
  • 复习:知识的温故知新
  • 练习:知识的实践应用

目录

一,原题力扣链接

二,题干

三,建表语句

四,分析

五,SQL解答

六,验证

七,知识点总结


一,原题力扣链接

. - 力扣(LeetCode)

二,题干

表: Student

+--------------+---------+
| Column Name  | Type    |
+--------------+---------+
| student_id   | int     |
| student_name | varchar |
| gender       | varchar |
| dept_id      | int     |
+--------------+---------+
student_id 是该表的主键(具有唯一值的列)。
dept_id是Department表中dept_id的外键。
该表的每一行都表示学生的姓名、性别和所属系的id。

表: Department

+-------------+---------+
| Column Name | Type    |
+-------------+---------+
| dept_id     | int     |
| dept_name   | varchar |
+-------------+---------+
dept_id是该表的主键(具有唯一值的列)。
该表的每一行包含一个部门的id和名称。

编写解决方案,为 Department 表中的所有部门(甚至是没有当前学生的部门)报告各自的部门名称和每个部门的学生人数。

按 student_number 降序 返回结果表。如果是平局,则按 dept_name 的  字母顺序 排序。

结果格式如下所示。

示例 1:

输入: 
Student 表:
+------------+--------------+--------+---------+
| student_id | student_name | gender | dept_id |
+------------+--------------+--------+---------+
| 1          | Jack         | M      | 1       |
| 2          | Jane         | F      | 1       |
| 3          | Mark         | M      | 2       |
+------------+--------------+--------+---------+
Department 表:
+---------+-------------+
| dept_id | dept_name   |
+---------+-------------+
| 1       | Engineering |
| 2       | Science     |
| 3       | Law         |
+---------+-------------+
输出: 
+-------------+----------------+
| dept_name   | student_number |
+-------------+----------------+
| Engineering | 2              |
| Science     | 1              |
| Law         | 0              |
+-------------+----------------+

三,建表语句

import  pandas as pd

data = [[1, 'Jack', 'M', 1], [2, 'Jane', 'F', 1], [3, 'Mark', 'M', 2]]
student = pd.DataFrame(data, columns=['student_id', 'student_name', 'gender', 'dept_id']).astype({'student_id':'Int64', 'student_name':'object', 'gender':'object', 'dept_id':'Int64'})
data = [[1, 'Engineering'], [2, 'Science'], [3, 'Law']]
department = pd.DataFrame(data, columns=['dept_id', 'dept_name']).astype({'dept_id':'Int64', 'dept_name':'object'})

四,分析

题解:

表1:学生表

字段:学生id,学生姓名,学生性别,班级id

表2:班级表

班级id,班级姓名

求每个班级一共有多少个学生,统计包括没学生的也要

第一步,连接两个表  用左连接 以班级为主 连接学生表

第二步:  一班级分组,count学生id的数量 最后按照要求排序  改名输出

五,Pandas解答

import pandas as pd

def count_students(student: pd.DataFrame, department: pd.DataFrame) -> pd.DataFrame:
    df =pd.merge(department,student,how='left',on='dept_id')
    res = df.groupby(['dept_id','dept_name'])['student_id'].count().reset_index()
    res1 = res[['dept_name','student_id']]
    res2 = res1.rename(columns={'student_id':'student_number'})
    res3 = res2.sort_values(['student_number','dept_name'],ascending=[False,True])
    return res3

六,验证

七,知识点总结

  • Pandas中 左连接的运用 API: merge....how...left
  • Pandas中分组聚合的运用  groupby.count
  • Pandas中重置索引的运用 reset_index()
  • Pandas中改名的运用 rename()
  • Pandas中排序的运用 sort_values
  • 统计不同班级的学生人数  如果班级没人就读显示为0 最后排序的题~

  • 学习:知识的初次邂逅
  • 复习:知识的温故知新
  • 练习:知识的实践应用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值