pandas数据清洗
在数据分析的过程中,原始数据可能在采集的过程中会出现空值或者重复值,为了避免对结果产生影响,我们会对这些异常值进行清理
- 处理缺失值(空值NaN)
- 处理重复值(整行整行重复)
- 处理异常值
python函数中如果不定义返回值那么就会返回一个None(就是空的意思),在pandas中使用Nan这个来表示None的意思
挖空
隐式索引
删除空值所在的行数据
– isnull、 notnull、 any、 all
判断
只要有一个为空就会返回布尔值True
pandas数据清洗
在数据分析的过程中,原始数据可能在采集的过程中会出现空值或者重复值,为了避免对结果产生影响,我们会对这些异常值进行清理
判断
只要有一个为空就会返回布尔值True