Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。
DataFrame数据格式
fillna方式实现
groupby方式实现
DataFrame数据格式
以下是数据存储形式:
fillna方式实现
1、按照industryName1列,筛选出业绩
2、筛选出相同行业的Series
3、计算平均值mean,采用fillna函数填充
4、append到新DataFrame中
5、循环遍历行业名称,完成2,3,4步骤
factordatafillna = pd.DataFrame()
industrys = newfactordata1.industryName1.unique()
for ind in industrys:
t = newfactordata1.industryName1 == ind
a = newfactordata1[t].fillna(newfactordata1[t].mean())
factordatafillna = factordatafillna.append(a)
groupby方式实现
采用groupby计算,详细见代码注释
df = pd.DataFrame({'code':[1,2,3,4,5,6,7,8],
'value':[np.nan,5,7,8,9,10,11,12],
'value2':[5,np.nan,7,np.nan,9