目录
数据预览:
一、查看缺失值
数据.isnull()
如果该处数据为空显示True,不为空显示False
二、处理缺失值
1.删除dropna
(1)参数介绍
DataFrame.dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)
参数 | 介绍 |
axis | 0是删除包含缺失值的行(默认是这个) 1是删除包含缺失值的列 |
how | any只要有一个缺失值就删除该行或列 all全是缺失值才删除该行或列 |
thresh | 如果少于thresh个非缺失值就删除该行或列 |
subset | 指定要查看的列 |
inplace | 是否在原数据上操作True/False |
(2)使用方法示例
A.删除有空值的整行
data.dropna()
所有有空值的行都已被删除,剩下的都是非空值
B.删除有空值的整列
data.dropna(axis=1)
如图,各列只有序号和姓名列没有空值被保留了下来
C.删除一行全是空值的整行
data.dropna(how="all")
由B可知本数据中序号和姓名列无空值,并不存在全是空值整行,所以经此操作并没有数据被删除
D.删除非空值低于指定数值的整行
data.dropna(thresh=3)
非空值低于3的只有李平平和卢海军,这两人的数据均已被删除
E.删除指定列中有空值的整行
data.dropna(subset=['语文','英语'])
只要语文或者英语二者之一有空值即被删除
2.填充fillna
(1)给所有空值填充指定数值
data.fillna(211)
(2)给指定列填充指定数值
运用字典,将列名作为key,指定值作为value写入字典
data.fillna({"语文":211,"数学":985,"英语":666})
三、源数据网盘链接
链接:https://pan.baidu.com/s/10BpZWFj6K9-UOVJwuQH5VA
提取码:1234