1.temp[col] = df.apply(lambda x:int(x[col]==large_values),axis=1)
表示给temp【col】赋值:非空为true,赋值为1,空值为false,赋值为0,整个col列按0-1分类
2.values = [i for i in allData[col] if i==i]
true时返回 i ,非空值时为true,空值、0、none等为false
用来筛选非空值
3.values = [i for i in allData[col] if i != i]
空值时返回i:空值时前面加了非,为true,返回i
用来筛选空值
4.missing_varls = df[x].apply(lambda x:int(x!=x),axis=1)
空值 返回 1,空值时,加了个非,为true,返回1;
非空时返回0,非空值,加了个非,为false,返回0;
统计空值个数
不懂 不懂 纯属虾总结