Pandas分组统计占比
数据例如:
美赞臣标签 2017-11-15 MOB 女性 110548715660
美赞臣标签 2017-11-15 MOB 男性 104342715471
美赞臣标签 2017-11-15 PC 女性 398273 887
美赞臣标签 2017-11-15 PC 男性 4691261055
处理需求:
分组统计性别占比
处理过程如下:
import pandas as pd
import numpy as np
df=pd.DataFrame({'key1':['美赞臣2017-11-15MOB','美赞臣2017-11-15MOB','美赞臣2017-11-15PC','美赞臣2017-11-15PC'],'key2':['女性','男鞋','女性','男性'],'imp':[1105487,1045427,3911,3922]})
df
group1=df.groupby(['key1','key2'])
group2=df.groupby(['key1'])
a1=group1.sum().reset_index()
b1=group2.sum().reset_index()
p=pd.merge(a1,b1,how='outer',on='key1')
m=p["imp_x"]/p