代码能力比较差,网上搜了很多都不能实现需求,于是自己办法实现了,代码能力较差,请轻喷。
最简单的命令就是,把含有空值的行全部进行剔除
data=data.dropna(axis=0)#空值全部剔除
需求如下:假设存在如下数据,想要每行或者每列的空值数量进行筛选,剔除掉空值>3的行或列。
按行筛选:
isdrop=[]#空的索引
#遍历行
for index,row in data.iterrows():
if row.isna().sum()>3:
isdrop.append(1)#如果空值数超过3个,则索引为1
else:
isdrop.append(0)#不然索引为2
data.insert(loc=0,column="isdrop",value=pd.array(isdrop))#数据插入该索引列
data2=data[data["isdrop"]==0] #筛选出空值少于3个的行
按列筛选空值类似,由于作业还没写到,就还没更新,后续文章会补全,如果有大佬可以帮忙完善代码久更好啦~