数据清洗常用函数——drop fillna
1
dropna 清理无效数据,默认how=any,axis=0 将含有Nan的行删除
how可选=any all
axis=0删除行 =1 删除列
thresh参数=3 说明这一行有>=3个Nan时改行才会被删
2.
drop按照条件删除行/列
删除某行/列 按照索引
删除某列:
删除某行:
条件删除:如果A列中含有的元素小于2或者大于80,则删除此行
data3=df.drop(df[(df[‘A’]<2)|(df[‘A’]>80)].index)
执行前:
执行后:
A列中大于80的行被删去
2.fillna函数 填充空值
array.fillna(10) 数值填充
不同列不同数值填充:
用该列的前一个/后一个非NaN的值填充NaN
ffill与bfill
data3=df.fillna(method=‘bfill’)
同下一列的数一样