我有一个多索引数据帧,在级别1上有gappy日期值,如下所示:np.random.seed(456)
j = [(a, b) for a in ['A','B','C'] for b in random.sample(pd.date_range('2018-01-01', periods=100, freq='D').tolist(), 5)]
j.sort()
i = pd.MultiIndex.from_tuples(j, names=['Name','Date'])
df = pd.DataFrame(np.random.random_integers(0,100,15), i, columns=['Vals'])
# print(df):
Vals
Name Date
A 2018-01-01 27
2018-01-08 43
2018-03-26 89
2018-03-29 42
2018-04-01 28
B 2018-01-02 79
2018-01-26 60
2018-02-18 45
2018-03-11 37
2018-03-23 92
C 2018-03-17 39
2018-03-20 81
2018-03-21 11
2018-03-27 77
2018-04-08 69
对于每个级别0的值,我希望在索引级别1中填充该级别0的最小和最大日期值之间的每个日历日期。(This Q&A解决了使用为所有级别0值设置的相同的值填充级别1的场景。)
例如,对于subset = df.loc['A'],我想插入行,以便subset.index.values == pd.date_range(subset.index.values.min(), subset.index.values.max()).values。一、 例如,生成的数据帧如下所示:
^{pr2}$
有没有一种通俗易懂的方法来实现这一点?在
{a2每一帧都可以迭代地到达0级。或者类似地迭代地构造一个索引值列表,然后使用原始数据帧^{}对它们进行处理。)