python去重、根据某列统计另一列频数
假如有如下格式的数据,实现两个操作:(1)根据“ABC”列去重;(2)根据"jd"列统计“cun”
代码如下:
(1)去重
data1=data.drop_duplicates('ABC') # 删除掉重复的行,在原值上直接修改
len(data1)
data1.to_excel('data1.xlsx')
data1.head(10)
结果:
(2)根据‘jd’数据频数
####统计频数
data1.groupby(['jd']).size()
结果:
根据根据"jd"列统计“cun”
data1.groupby(['jd','cun']).size()