DataFrame-GroupBy 按照相同id合并相应数据

 问题描述

"""
    id  counts
0  001      12
1  002       3
2  001       4
按对应id整理整理成如下格式
id
001    16
002     3
"""

python实现:

import pandas as pd
df = pd.DataFrame({'id': ['001', '002', '001'],
                   'counts': [12, 3, 4]},
                  columns=['id', 'counts'])
print(df)
# df_merge = df.groupby('id')['counts'].sum()
df_merge = df['counts'].groupby(df['id']).sum()
print(df_merge)

note:

1. df.groupby会生成一个GroupBy的对象,实际并没有进行任何计算(只是生成了一些有关分组键df['id']的中间数据),然后可以调用mean(), count(), sum()等方法产生一个Series,其中索引为‘id’中的唯一值。

2. 用法是:(真正需要计算的数据列).groupby(df['分组规则列']).计算函数()

3. 若分组规则列有多个,又想得到df形式的结果,可以使用reset_index()转换。

4.GroupBy对象还可以分组迭代,用法如下:

for name, group in grouped:
    print(name)
    print(group)

 

  • 2
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用pandas库来实现这个功能。具体步骤如下: 1. 使用pandas读取Excel文件,将数据转换为DataFrame格式。 2. 使用pandas中的shift函数,可以将某一列的数据向上或向下移动一行,然后与原列进行比较,得到一个布尔型的Series。 3. 将得到的布尔型Series进行累加,可以得到一个新的列,表示每个连续的相同数据块的编号。 4. 使用pandas中的groupby函数,按照新的列进行分组,然后使用agg函数来对每个分组进行操作,可以将每个分组中的数据合并为一行。 5. 将处理后的数据保存到Excel文件中。 以下是示例代码: ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx') # 使用shift函数,得到一个布尔型Series same_as_previous = df['A'] == df['A'].shift(1) # 累加得到新的列 group_id = same_as_previous.cumsum() # 按照新的列进行分组,然后使用agg函数将每个分组合并为一行 df_grouped = df.groupby(group_id).agg({ 'A': 'first', 'B': 'sum', 'C': 'sum', }) # 将处理后的数据保存到Excel文件中 df_grouped.to_excel('result.xlsx', index=False) ``` 上述代码中,假设需要处理的Excel文件名为data.xlsx,其中需要合并的列为A列,需要求和的列为B列和C列。处理后的结果保存到result.xlsx文件中。需要注意的是,上述代码中的示例数据是数字类型,如果需要处理文本类型的数据,需要将代码中的求和操作替换为字符串连接操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值