数据为m行n列的dataframe数据,直接调用函数即可。
#删除所有样本中缺失值超过20%的行
def del_rows(data):
t = int(0.8*data.shape[1])
data = data.dropna(thresh=t)#保留至少有 t 个非空的行
#data = data[(data.T != 0).any()]
return data
#删除所有行中缺失值超过20%的列
def remcolumns(data):
t = int(0.8*data.shape[0])
data = data.dropna(thresh=t,axis=1)#保留至少有 t 个非空的列
#data = data.loc[:, (data != 0).any(axis=0)]
return data