Missing data imputation with Impyute
在缺失值填充中,python中有一些开源的方法。
这些方法主要是包括:
删除法(most searched in google,but do nothing to impute the missing data),均值法,回归法,KNN,MICE,EM等。
首先介绍其中一个常见的包:impyute 这是其用户文档
使用KNN进行插值
from impyute.imputation.cs import fast_knn
import pandas as pd
import numpy as np
df = pd.DataFrame([[np.nan,2,np.nan,0],
[3,4,np.nan,1],
[np.nan,np.nan,np.nan,5]