“熊猫”表示这些数据的方式可能是将其编码为缺失数据,例如:In [562]: df
Out[562]:
store day items
0 a 1 4
1 a 1 3
2 a 2 1
3 a 3 5
4 a 4 2
5 a 5 9
6 b 1 1
7 b 2 3
8 b 3 NaN
9 b 4 NaN
然后,在计算客户的聚合中,可以使用count,它排除了缺少的值,例如:
^{pr2}$
编辑:
关于添加缺失值,这里有一些想法。假设您有一个只包含缺失对的数据帧,如下所示:In [571]: df_missing
Out[571]:
store day
8 b 3
9 b 4
然后,您可以将这些添加到现有的数据帧中以填充缺失的数据帧,如下所示:In [574]: pd.concat([df, df_missing], ignore_index=True)
Out[574]:
day items store
0 1 4 a
1 1 3 a
2 2 1 a
3 3 5 a
4 4 2 a
5 5 9 a
6 1 1 b
7 2 3 b
8 3 NaN b
9 4 NaN b
或者,如果您有一个数据帧,其中包含您“应该”拥有的对(a1-5,b1-4),您可以将其与数据合并以填充缺失的部分。例如:In [577]: df_pairs
Out[577]:
store day
0 a 1
1 a 1
2 a 2
3 a 3
4 a 4
5 a 5
6 b 1
7 b 2
8 b 3
9 b 4
In [578]: df_pairs.merge(df, how='left')
Out[578]:
store day items
0 a 1 4
1 a 1 3
2 a 1 4
3 a 1 3
4 a 2 1
5 a 3 5
6 a 4 2
7 a 5 9
8 b 1 1
9 b 2 3
10 b 3 NaN
11 b 4 NaN