缺失值观察与处理 观察缺失值 #方法1 df.info() #方法2 df.isnull().sum() 处理缺失值 #方法1 df[df['列名']==None]=0 #方法2 df[df['列名'].isnull()]=0 #方法3 df[df['列名 '] == np.nan] = 0 np.nan比None好用,因为数值列读取数据后,空缺值的数据类型为float64,用None一般索引不到。 重复值观察与处理 查看重复值 df[df.duplicated()] 处理重复值 #整行有缺失值的清理方法 df.drop_duplicates().head()