Pandas如何删除重复的数据但保留最大值的行
@date: 2022/12/15
@author: SUFEHeisenberg
1. 删除一列中的重复内容并保留包含最大值的行
df.sort_values('var2', ascending=False).drop_duplicates('var1').sort_index()
2. 删除多列中的重复数据并保留包含最大值的行
df.sort_values('var3', ascending=False).drop_duplicates(['var1', 'var2']).sort_index()
Reference
Pandas如何删除重复的数据但保留最大值的行