在做数学建模比赛中遇到的一个小问题。
已知一个大量离散的数据的excel表,为了简化计算,我们需要将同列项相加。
如下图所示(注意,这里的数据量多达2万行,肯定不能手工计算)
因此,我们利用python的panda对数据进行分组合并相加,代码如下。
import pandas as pd
# 读取Excel表格
df = pd.read_excel('Tu.xlsx', sheet_name='Sheet1')
# 根据前两列分组并求和第三列数据
result = df.groupby(['start', 'end'])['weight'].sum().reset_index()
# 将结果导出到Excel表格
result.to_excel('result.xlsx', index=False)
# 输出完成提示
print('导出完成!')
将新的数据导出到名为“result.xlsx”的新表中,最终简化成一千多行。