python pandas实现partition by组内排序功能

最新推荐文章于 2023-02-07 11:19:49 发布

Python小萝卜

最新推荐文章于 2023-02-07 11:19:49 发布

阅读量3.3k

点赞数 2

分类专栏：数据预处理 python 文章标签： partition by 组内排序

本文链接：https://blog.csdn.net/qq_23860475/article/details/106941043

版权

python 同时被 2 个专栏收录

35 篇文章 5 订阅

订阅专栏

数据预处理

9 篇文章 3 订阅

订阅专栏

不需要排名列直接得出每门科目前2名数据：

import pandas as pd
import numpy as np
dic={'科目':['语文','语文','语文','语文','数学','数学','数学','数学','英语','英语','英语','英语'],
         '姓名':['赵大','钱二','孙三','李四','周五','郑六','王七','朱八','小红','小明','小李','小王'],
         '分数':[95,84,93,88,91,93,84,85,94,93,83,87]}
data=pd.DataFrame(dic)#转为DataFrame
data=data.sort_values('分数', ascending = False)
data_select = data.groupby('科目').head(2).sort_values('科目')

需要排名列：

import pandas as pd
import numpy as np
dic={'科目':['语文','语文','语文','语文','数学','数学','数学','数学','英语','英语','英语','英语'],
         '姓名':['赵大','钱二','孙三','李四','周五','郑六','王七','朱八','小红','小明','小李','小王'],
         '分数':[95,84,93,88,91,93,84,85,94,93,83,87]}
data=pd.DataFrame(dic)#转为DataFrame
data['rank'] = data.groupby('科目')['分数'].rank(ascending = False)
data_select=data[data['rank']<=2]

如果对你有帮助，请点下赞，予人玫瑰手有余香！

时时仰望天空，理想就会离现实越来越近！

Python小萝卜

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
python pandas实现partition by组内排序功能

import pandas as pdimport numpy as npdic={'科目':['语文','语文','语文','语文','数学','数学','数学','数学','英语','英语','英语','英语'], '姓名':['赵大','钱二','孙三','李四','周五','郑六','王七','朱八','小红','小明','小李','小王'], '分数':[95,84,93,88,91,93,84,85,94,93,83,87]}data=pd.DataF.
复制链接

扫一扫