背景
- 当前有如图三个字段:
“尺码系数”、“颜色汇总尺码系数”、“比例” - 现已知这三个字段的数学关系:
SUM(“尺码系数”) GROUP BY “颜色” = “颜色汇总尺码系数”
“尺码系数” / “颜色汇总尺码系数” = “比例”
-现DataFrame为商品维度,维度关系为 商品:颜色 = n:1
-已存在“尺码系数”字段,需新增“颜色汇总尺码系数”、“比例”两个字段
实现
假设DataFrame 为 df
已存在字段为[‘商品’,‘颜色’,‘尺码系数’]
df = pd.Dataframe(columns=['商品', '颜色', '尺码系数'], datas=datas]
colour_size_factor_sum = df.groupby('颜色')['尺码系数'