python pandas新增加一列_python-如何在 pandas 中`groupby`之后根据顺序添加一列？

最新推荐文章于 2023-09-12 10:04:14 发布

weixin_39882623

最新推荐文章于 2023-09-12 10:04:14 发布

阅读量1.5k

点赞数

文章标签： python pandas新增加一列

在pandas中，通过groupby操作后，如何按照顺序添加权重列，并获取每个组的前两行。数据包含pid、query、title、label、predict、prob和score等字段。通过计算cumcount()可以实现组内顺序，并用head(2)获取每组的前两条记录。

摘要由CSDN通过智能技术生成

我的数据就像,我想计算NDCG指标

pid query title label predict prob

0 1 A a 0 2 0.9

1 1 A b 2 0 0.8

2 1 A c 1 2 0.7

3 2 D d 3 1 0.8

4 2 D e 4 2 0.9

经过分组操作

each_pid = data.groupby(data['pid']).apply(lambda g: g.sort_values(['predict', 'prob'], ascending=False))

我得到了这样的 dataframe .

pid query title label predict prob score

pid

1 0 1 A a 0 2 0.9 6

2 1 A c 1 2 0.7 18

1 1 A b 2 0 0.8 42

2 4 2 D e 4 2 0.9 186

3 2 D d 3 1 0.8 90

现在,我想要另一列名称权重,该权重的值取决于每个组的顺序,如下所示.

pid query title label predict prob score weight

pid

1 0 1 A a 0 2 0.9 6 1

2 1 A c 1 2 0.7 18 2

1 1 A b 2 0 0.8 42 3

2 4 2 D e 4 2 0.9 186 1

3 2 D d 3 1 0.8 90 2

以及如何获得每个组的前2行

pid query title label predict prob score weight

pid

1 0 1 A a 0 2 0.9 6 1

2 1 A c 1 2 0.7 18 2

2 4 2 D e 4 2 0.9 186 1

3 2 D d 3 1 0.8 90 2

有人可以帮忙吗？

data = data.groupby(level=0).head(2)

data['weight'] = data.groupby(level=0).cumcount()+1

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39882623

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python groupby apply_使用groupby和apply向每个组添加列

weixin_39898011的博客

12-21

1606

我有一个以多索引作为列的数据帧。我想按级别1分组并应用一个生成新列的函数。我希望将这个计算列添加到每个组中，因此我的dataframe为每个组添加新列。在我做了一个小的虚拟脚本和函数来复制我想做的事情。在import pandas as pdimport numpy as npcolumns = [('A','julian'),('A','geoffrey'),('B','julian'),('B...

python pandas 增加一列_在Python Pandas Dataframe中动态添加列的数据处理

weixin_42548888的博客

01-12

2013

我有以下问题.可以说这是我的CSVid f1 f2 f31 4 5 51 3 1 01 7 4 41 4 3 11 1 4 62 2 6 0..........因此,我有可以按ID分组的行.我想创建如下的csv作为输出.f1 f2 f3 f1_n f2_n f3_n f1_n_n f2_n_n f3_n_n f1_t f2_t f3_t4 5 5 3 ...

参与评论您还未登录，请先登录后发表或查看评论

python groupby count_python – Pandas使用groupby中的count来创建新列

weixin_39630999的博客

12-21

3501

这不是一个新专栏,这是一个新的DataFrame：In [11]: df.groupby(["item", "color"]).count()Out[11]:iditem colorcar black 2truck blue 1red 2要获得所需的结果,请使用reset_index：In [12]: df.groupby(["item", "color"])["id"]....

Dataframe groupby之后统计每个分组长度并创建新列

最新发布

qq_42000218的博客

09-12

505

最近在做数据处理的时候遇到了一些问题，需要将一个dataframe按照一定的条件groupby之后，统计每个group的长度，并在原始的dataframe中创建一个新的列。

python 利用 pandas 进行组内排序、单组排序、标号

weixin_44166997的博客

03-21

3282

如果只是单纯想对某一列进行排序，而不进行打序号的话直接使用.sort_values就可以了。下文是关于如何把序号也打上的 1·首先是不分组进行排序（按user_id排序）数据格式如下： data1['sort_num']=data1['user_id'].rank(ascending=1,method='first') data1['sort_num']=data1['user_id']...

python pandas 数据groupby后排序

weixin_45887999的博客

07-09

1万+

python pandas 数据groupby后排序 import pandas as pd import numpy as np df = pd.DataFrame(pd.read_csv(r"/Users/fjj/Desktop/students_complete.csv")) #打印前10行数据 print(df.head(10)) #计算学生的数学平均分 print('学生的数学平均分为：',df.agg({'math_score':np.mean})) #有多少同学数学没有及格 df1 = df[

pandas官方文档中文版_python教程_pandas中文API_pandas中文_

10-02

通过`groupby()`函数，可以基于一个或多个列对数据进行分组，然后对每个组执行聚合操作（如`sum()`, `mean()`, `count()`）。这在分析分组统计数据时非常有用。 **7. 数据透视表** Pandas的`pivot_table()`函数...

python pandas新增加一列_在Python中的Pandas中向现有DataFrame添加新列

weixin_32820805的博客

03-01

3829

在本教程中，我们将学习如何在pandas中向现有DataFrame添加新列。我们可以有不同的方法来添加新列。让我们所有人。使用列表我们可以使用该列表添加新列。请按照以下步骤添加新列。算法1.CreateDataFrameusingadictionary.2.Createalistcontainingnewcolumndata.Makesurethattheleng...

pandas官方文档中文版_pandas_pandas文档_pandas中文_python_

09-29

Pandas是Python编程语言中的一个强大数据分析工具，它提供了高效的数据结构，如DataFrame和Series，使得数据清洗、转换、分析变得简单易行。Pandas的设计目标是使数据处理对用户来说直观且快速，同时保持良好的性能...

python求一列和并添加新列_python中pandas.DataFrame对行与列分享和及添加新行与列示例...

weixin_32691939的博客

01-14

917

python中怎样在dataframe变量中增加一列需要在dataframe变量(df)中增加一列(columC)数据，这列数据的值和df在Python中怎么在一个原有的DataFrame中加一新的列名并设置其NaN值全部转化为0伤口再痛痛不过背叛的伤痛，泪水再多多不过你给的冷漠怎样得到pandas中dataframe的行数和列数如若相爱，便珍惜那唯一的芳华。如若错过，便珍惜她停留在心间的美好。d...

Pandas详解十六之groupby分组后分开运算

yungeisme的博客

05-31

2万+

约定 import pandas as pd import numpy as np groupby分组后分开运算 Groupby对象支持迭代，当我们分组后想保存分组结果而不想运算，或者分别对每组进行不同的运算，这时是十分有用的。 1 创建 df1=pd.DataFrame({'Data1':np.random.randint(0,10,5),'Data2':np.random.ran...

Pandas groupby用法

背着行囊去远方的博客

09-12

2349

groupby的用法大致就先到这，后续还有更多的补充。分组后，可以选取单列数据，或者多个列组成的列表（

Group by分组，为分组后的数据添加序号

开开心心，努力生活

04-26

3741

需求如下：根据两个日期区间查询出两个查询列表，表1、表2。并根据日期，以及名称进行group by，并合并数量本期数量、同期数量。其中查询出来的数据，可能表2不存在表1的日期，所以不能用时间来合并数据。 SQL代码如下： select t.cyr,t.orders,t.date, sum(case when t.b_cn ='b_cn' then 0 else t.b_cn end) b_cn, sum(case when t.t_cn ='t_cn' then 0 else t.t_cn end) t

pandas之分组groupby()的使用整理与总结

敲代码的quant的博客

07-27

15万+

前言在使用pandas的时候，有些场景需要对数据内部进行分组处理，如一组全校学生成绩的数据，我们想通过班级进行分组，或者再对班级分组后的性别进行分组来进行分析，这时通过pandas下的groupby()函数就可以解决。在使用pandas进行数据分析时，groupby()函数将会是一个数据分析辅助的利器。 groupby的作用可以参考超好用的 pandas 之 groupby 中作者的插图进行直...

Python Pandas Groupby教程

cumei1658的博客

07-15

9624

In this Pandas group by we are going to learn how to organize Pandasdataframes by groups. More specifically, we are going to learn how to group by one and multiple columns. Furthermore, we are going ...

python增加一列数据_使用 pandas 添加一列数据

weixin_39989941的博客

11-27

3750

import jqdataimport pandas as pdfrom pandas import DataFrameimport numpy as npsecurity = ['000001.XSHE', '000040.XSHE', '000099.XSHE'];h = get_price(security, start_date='2020-03-26', end_date='2020-0...

python pandas新增加一列_Python Pandas 对列/行进行选择，增加，删除操作

weixin_39654436的博客

12-04

6913

一、列操作1.1 选择列d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}df = pd.DataFrame(d)print (df ['one'])# 选择其中一列进行显示，列长度为最长列的长度# 除了 index...

利用pandas中groupby解决分组对象的组内排序问题

guofei_fly的博客

06-27

4万+

问题：根据数据某列进行分组，选择其中另一列大小top-K的的所在行数据解析：求解思路很清晰，即先用groupby对数据进行分组，然后再根据分组后的某一列进行排序，选择排序结果后的top-K结果案例：取一下dataframe中B列各对象中C值最高所在的行 df = pd.DataFrame({"A": [2, 3, 5, 4], "B": ['a', 'b', 'b', 'a'], "C": [...

python/pandas数据挖掘（十四）-groupby,聚合，分组级运算