1. 问题
【问题一】 如何删除缺失值占比超过25%的列?
# 构建一个DataFrame
df = pd.DataFrame({
'a':[1, 2, 3, 4], 'b':[5, 6, np.nan, 8], 'c':[9, np.nan, np.nan, 10], 'd':[11, np.nan, np.nan, np.nan]})
# 其中df为输入的DataFrame, n为百分比
def drop_nan(df, n):
list_drop = []
df_list = list(df.columns)
for i in df_list:
if ((df[i].isna().sum(