一.删除数据
二.空值的处理
df.fillna(value=None,method=None,axis=0,inplace=False,limit=None,downcast=None,**kwargs)
value:填充空值
method:{bfill、backfill、ffill、pad、None}
bfill、backfill填充前一行、列
pad、ffill填充后一行或者是列
df.fillna(0) #用常数填充
df.fillna(df.mean()) #用列平均值填充
df.fillna(method='ffill',axis=0) #用前一行的数据填充
三.对于重复数据的处理
1.df.duplicated() 返回一个bool类型的Series。
使用drop_duplicates()可以将重复的数据删除掉。