Pandas使用这些函数处理缺失值:
-
isnull 和 notnull : 检查是否空值,可用于 df 和 series
-
dropna : 丢弃、删除缺失值
① axis : 删除行还是列,{0 or ‘index’, 1 or ‘columns’}, default 0
② how : 如果等于 any 则任何值为空都删除,如果等于 all 则所有值都为空才删除 -
fillna : 填充空值
① value :用于填充的值,可以是单个值,或者字典(key 是列名,value是值)
② method : 等于 ffill 使用前一个不为空的值填充 forword fill;等于 bfill 使用后一个不为空的值填充 bacword fill
③ axis :按行还是列填充,{0 or ‘index’, 1 or ‘columns’}
④ inplace:如果为 True 则修改当前 df,否则返回新的 df
以下我们进行特殊 Excel 的读取、清洗、处理实例训练:
0.数据介绍
我们导入的数据是一个不规则的学生分数数据,左边有一列空行,上面有两行空行,小王数学成绩成绩为空。
我们要处理后的数据是这样的:
1.读取 Excel 的时候,忽略前几行
2. 检测空值
3. 删除全是空值的列
4. 删除全是空值的行
5. 将分数列为0的值填充为0分
6.将姓名的缺失值填充
使用前面的有效值填充,用ffill: forward fill