import pandas as pd
# 示例DataFrame
df = pd.DataFrame({
'金钱': [100, 200, 300, 100, 200],
'人名1': ['Alice', 'Bob', 'Alice', 'Bob', 'Alice'],
'人名2': ['Charlie', 'David', 'Eve', 'Frank', 'Charlie']
})
# 将DataFrame转换为长格式,这样每个人名都会成为单独的行
long_df = df.set_index('金钱').stack().reset_index()
long_df = long_df.drop('level_1', axis=1) # 删除多余的列
long_df.columns = ['金钱', '人名']
# 使用groupby对人名进行分组,并使用sum计算每个分组的金钱总和
total_money_per_name = long_df.groupby('人名')['金钱'].sum().reset_index()
# 输出结果
print(total_money_per_name)
在这个例子中,set_index('金钱').stack().reset_index()
是将原始的宽格式DataFrame转换为长格式的关键步骤。stack
函数将多列人名转换为一个单独的列,并且每行都包含金钱的值。然后,groupby('人名')
按人名进行分组,sum()
计算每个分组的金钱总和。最后,reset_index()
用于将结果转换回常规的DataFrame格式。