用python把相同名称的放在一起_python – 将具有相同列值的连续行组合在一起

最新推荐文章于 2023-02-16 21:07:38 发布

weixin_39923262

最新推荐文章于 2023-02-16 21:07:38 发布

阅读量2.1k

点赞数

文章标签：用python把相同名称的放在一起

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39923262/article/details/114030678

版权

使用Python的pandas库，通过.groupby()方法结合.sort=False保持原始顺序，对具有相同列'b'值的连续行进行聚合，利用.apply()函数将'a'列的值连接。此外，为处理非连续重复值，可以创建'key'列来跟踪连续数据组，然后根据'key'和'b'进行分组。

摘要由CSDN通过智能技术生成

@ rfan的回答当然有效,作为替代,这是使用熊猫

groupby的方法.

.groupby()按“b”列对数据进行分组 – sort = False是保持订单完整所必需的. .apply()将函数应用于每组b数据,在这种情况下,将字符串连接在一起,用空格分隔.

In [67]: df.groupby('b', sort=False)['a'].apply(' '.join)

Out[67]:

b

DT The

Org Skoll Foundation

, ,

VBN based

IN in

Location Silicon Valley

Name: a, dtype: object

编辑：

为了处理更一般的情况(重复的非连续值) – 一种方法是首先添加一个跟踪列,该列跟踪每行适用的连续数据组,如下所示：

df['key'] = (df['b'] != df['b'].shift(1)).astype(int).cumsum()

然后将密钥添加到groupby中,即使重复值也应该有效.例如,使用带有重复的虚拟数据：

df = DataFrame({'a': ['The', 'Skoll', 'Foundation', ',',

'based', 'in', 'Silicon', 'Valley', 'A', 'Foundation'],

'b': ['DT', 'Or

最低0.47元/天解锁文章

weixin_39923262

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用python把相同名称的放在一起_python – 将具有相同列值的连续行组合在一起

@ rfan的回答当然有效,作为替代,这是使用熊猫groupby的方法..groupby()按“b”列对数据进行分组 – sort = False是保持订单完整所必需的. .apply()将函数应用于每组b数据,在这种情况下,将字符串连接在一起,用空格分隔.In [67]: df.groupby('b', sort=False)['a'].apply(' '.join)Out[67]:bDT ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。