我需要在一个Dataframe上插入NaN值,但我希望该插值能获得DataFrame的第一个值,以防NaN值是最后一个值.这是一个例子:
import pandas as pd
import numpy as np
df = pd.DataFrame.from_dict({"a": [1,2,3], "b":[1,2,np.nan]})
因此,DataFrame是:
a b
0 1 1.0
1 2 2.0
2 3 NaN
但是当我插值nan值时:
df.interpolate(method="linear", inplace=True)
我有:
a b
0 1 1.0
1 2 2.0
2 3 2.0
插值不使用第一个值来执行.由于圆弧插补,我希望的输出将填充1.5的值.
解决方法:
一种可能的解决方案是添加第一行,插值并删除最后一行:
df = df.append(df.iloc[0]).interpolate(method="linear").iloc[:-1]
print (df)
a b
0 1.0 1.0
1 2.0 2.0
2 3.0 1.5
编辑:
更一般的解决方案:
df = pd.DataFrame.from_dict({"a": [1,2,3,4], "b":[np.nan,1,2,np.nan]})
df = pd.concat([df]