也可以使用scikit-learn填充缺失值:使用scikit-learn中的SimpleImputer(原sklearn.preprocessing.Imputer)处理缺失值
函数原型以及参数说明
用法举例
>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],
... [3, 4, np.nan, 1],
... [np.nan, np.nan, np.nan, 5],
... [np.nan, 3, np.nan, 4]],
... columns=list('ABCD'))
>>> df
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN
>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],
... [np.nan, 2, 1, 0],
... [np.nan, 2, np.nan, 0],
... [np.nan, 2, np.nan, 0],
... [np.nan, 2, np.nan, 0],
... [np.nan, 2, 5, 0],
... [np.nan, 2, np.nan, 0],
... [np.nan, 2, np.nan, 0],
... [3, 4, np.nan, 1],
... [np.nan, np.nan, np.nan, 5],
... [np.nan, 3, np.nan, 4]],
... columns=list('ABCD'))
df.fillna(0, limit=2) # 使用limit限制填充缺失值的数量