python读取score的前三行_python – 对每个组pandas数据帧中的列进行排序并选择前n行...

最新推荐文章于 2022-12-19 12:02:23 发布

weixin_39853843

最新推荐文章于 2022-12-19 12:02:23 发布

阅读量396

点赞数

文章标签： python读取score的前三行

有两种解决方案：

df1 = df.sort_values('score',ascending = False).groupby('pidx').head(2)

print (df1)

mainid pidx pidy score

8 2 x w 12

4 1 a e 8

2 1 c a 7

10 2 y x 6

1 1 a c 5

7 2 z y 5

6 2 y z 3

3 1 c b 2

5 2 x y 1

df = df.set_index(['mainid','pidy']).groupby('pidx')['score'].nlargest(2).reset_index()

print (df)

pidx mainid pidy score

0 a 1 e 8

1 a 1 c 5

2 c 1 a 7

3 c 1 b 2

4 x 2 w 12

5 x 2 y 1

6 y 2 x 6

7 y 2 z 3

8 z 2 y 5

时序：

np.random.seed(123)

N = 1000000

L1 = list('abcdefghijklmnopqrstu')

L2 = list('efghijklmnopqrstuvwxyz')

df = pd.DataFrame({'mainid':np.random.randint(1000, size=N),

'pidx': np.random.randint(10000, size=N),

'pidy': np.random.choice(L2, N),

'score':np.random.randint(1000, size=N)})

#print (df)

def epat(df):

grouped = df.groupby('pidx')

new_df = pd.DataFrame([], columns = df.columns)

for key, values in grouped:

new_df = pd.concat([new_df, grouped.get_group(key).sort_values('score', ascending=True)[:2]], 0)

return (new_df)

print (epat(df))

In [133]: %timeit (df.sort_values('score',ascending = False).groupby('pidx').head(2))

1 loop, best of 3: 309 ms per loop

In [134]: %timeit (df.set_index(['mainid','pidy']).groupby('pidx')['score'].nlargest(2).reset_index())

1 loop, best of 3: 7.11 s per loop

In [147]: %timeit (epat(df))

1 loop, best of 3: 22 s per loop

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39853843

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python读取score的前三行_python – 对每个组pandas数据帧中的列进行排序并选择前n行...

有两种解决方案：df1 = df.sort_values('score',ascending = False).groupby('pidx').head(2)print (df1)mainid pidx pidy score8 2 x w 124 1 a e 82 1 c a 710 ...
复制链接

扫一扫

Pandas 学习笔记(2) excel 操作

dailinqing1984的博客

03-14

854

上一篇讲了DataFrame的基本操作,现在来对excel进行操作. 我们新建一个学生成绩表score.xlsx,如下 1. 读取excel文件 df1 = pd.read_excel("score.xlsx", "Sheet1") 2.使用df1.describe()计算平均分等数据 3.使用df1.isnull()判断是否有空数据,True代表是空,Fla...

mistake-输出前三名成绩

blackgirl1111的专栏

11-30

1483

/* 【项目2- 成绩处理】在数组score中将要存储某小组C++程序设计的成绩，请设计完成下面的各功能函数，并将它们组合成一个完整的应用：　　（1）输入小组人数及成绩；　　（2）输出该小组的最高成绩、最低成绩、平均成绩和成绩的标准偏差（标准偏差公式：，其中为样本，为均值，为样本数目）；　　（3）输出考得最高成绩和最低成绩的同学的人数及对应的学号（设成绩对应的下标即学号，可能有相同的成绩）

参与评论您还未登录，请先登录后发表或查看评论

python读取score的前三行_Python查找给定列中的最高行

weixin_39534149的博客

11-29

240

以下是使用Pandas的方法.It’s easy使用last_valid_index获取Pandas中的最后一个非空行.可能有更好的方法将结果DataFrame写入xlsx文件,但是,according to the docs,这种非常愚蠢的方式实际上是在openpyxl中完成的.假设您从这个简单的工作表开始：假设我们想将xxx放入C列：import openpyxl as xlimport pa...

Python3 numpy，pandas，DataFrame基本操作

霏霏_伊人

06-21

3426

本文以学生成绩表为例，做几道简单的题。题目（1）：求出每名同学的总成绩按总成绩排序重置排序后的索引按性别进行分组分析按总分进行分组统计，300分以下，300-400,400分以上代码： 1.求出每名同学的总成绩 import pandas as pd import numpy as np stu_score=pd.read_excel ('./data/stu_s...

【Python 趣味习题】

m0_66318554的博客

07-18

1790

纯属为了转行，方便看运行结果。】，一起探讨学习哦！，求其x,y的解。，你的认可是我创作的。，你的青睐是我努力的。，你的意见是我进步的。，你的喜欢是我长久的。

fp.rar_python_python 数据库_python读取数据_文件_读取文件

09-21

"fp.rar"这个文件可能是一个压缩包，里面包含了与Python文件操作、数据库连接以及数据读取相关的资源。在这里，我们将深入探讨这些关键知识点。 1. **Python 文件操作**： Python 提供了简洁易用的内置函数来处理...

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_

10-02

在数据分析领域，Python语言及其相关的库，如numpy、pandas和seaborn，是不可或缺的工具。本资源"**dataanaly_numpy_pandas_python_sebo301.com4_数据分析**"显然专注于帮助数据产品经理和数据分析师提升数据处理...

Python 中pandas.read_excel详细介绍

09-21

`pandas.read_excel`是Python数据分析库pandas中用于读取Excel文件的重要函数，它能够将Excel文件的数据加载到DataFrame对象中，便于后续的数据处理和分析。以下是对`pandas.read_excel`函数的详细说明： **参数...

python 读取数据.rar_python读取txt_数据转换_读txt数据_读取txt_读取txt数据

07-15

在Python编程语言中，处理文本数据是一项常见的任务，特别是当数据存储在TXT文件中时。TXT文件因其简单、通用的格式而广泛使用，但当数据以不规则的空格分隔时，读取和处理这些数据可能会变得复杂。本教程将深入探讨...

shapefile.rar_python 地理_python读取shp_python读取shp文件_shp_读取shp

07-14

在Python编程环境中，处理地理空间数据时，常常会遇到一种名为Shapefile的文件格式，它是一种广泛用于存储地理信息系统（GIS）矢量数据的标准。本篇文章将深入探讨如何使用Python来读取和操作Shapefile文件，以及...

Python数据分析三部曲Pandas篇.pdf

10-27

Python数据分析三部曲中的Pandas篇主要讲解了如何在Python环境中安装和使用Pandas库进行数据处理。Pandas是Python中一个强大的数据处理库，它提供了高效的数据结构，如DataFrame和Series，使得数据清洗、分析和操作...

python read excel.zip_excel读取_python excel_python_read_excel_pyt

07-15

`pd.read_excel()`函数可以读取Excel文件，并将其内容转换为一个DataFrame对象，这是pandas处理表格数据的主要数据结构。你可以选择指定sheet_name来读取特定的工作表，或者使用header参数来定义列名的位置。对于有...

python中pandas.DataFrame对行与列求和及添加新行与列示例

12-23

本文介绍的是python中pandas.DataFrame对行与列求和及添加新行与列的相关资料，下面话不多说，来看看详细的介绍吧。方法如下：导入模块： from pandas import DataFrame import pandas as pd import numpy as np ...

python项目源码_实例52_Pandas提取指定数据并保存在原Excel工作簿中.rar

04-11

在本项目源码"实例52_Pandas提取指定数据并保存在原Excel工作簿中"中，我们将深入探讨如何利用Python的Pandas库处理Excel文件，特别是如何从大型数据集中提取特定信息，并将这些筛选后的数据保存回原有的Excel工作簿...

Python数据分析与建模库-03数据分析处理库Pandas-1.数据读取