在数据清洗时,需要按照一定条件删除某些数据样本,利用布尔表达式、索引和
drop
方法可以实现。
1.pandas.drop()
df = df.drop(df[<some boolean condition>].index)
一个例子,删除dataframe中满足条件x
所在的行:
df_clear = df.drop(df[df['x']<0.01].index)
# 也可以使用多个条件
df_clear = df.drop(df[(df['x']<0.01) | (df['x']>10)].index) #删除x小于0.01或大于10的行
ref: https://stackoverflow.com/questions/13851535/delete-rows-from-a-pandas-dataframe-based-on-a-conditional-expression-involvinghttps://www.cnblogs.com/crazyant/p/11557980.html