我有一个文件,有来自83个气象站和每个站101年的每日降水量数据。我想确定每个站点每年NaN的数量。你知道吗
作为一个简短的例子,让我们假设我只有一个站,只关心1年的数据,2009年。你知道吗
如果我有这个:station_id year month 1 2 3
210018 2009 1 5 6 8
210018 2009 2 NaN NaN 6
210018 2009 12 8 5 6
我想说的是:station_id year month 1 2 3
210018 2009 1 5 6 8
210018 2009 2 NaN NaN 6
210018 2009 3 NaN NaN NaN
210018 2009 4 NaN NaN NaN
210018 2009 5 NaN NaN NaN
210018 2009 6 NaN NaN NaN
210018 2009 7 NaN NaN NaN
210018 2009 8 NaN NaN NaN
210018 2009 9 NaN NaN NaN
210018 2009 10 NaN NaN NaN
210018 2009 11 NaN NaN NaN
210018 2009 12 8 5 6
因此,我的电台需要12排12个月和一年的时间来配合每一排。同样,我有101年的真实例子。你知道吗
我正在尝试使用以下代码:df_indexed=df.set_index(['year'])
new_index=np.arange(1910,2011,1)
idx=pd.Index(new_index)
df2=df_indexed.reindex(idx, method=None)
但它返回一个以
ValueError: cannot reindex from a duplicate axis
我希望这是有道理的。你知道吗