缺失值:python中显示为NaN,python用np.nan,None表示
在简单的运算+-*/中,有缺失值的画,运算结果在相应的位置上也是缺失值
在描述性统计sum,mean,min.max等中,NaN都是作为0进行运算
操作:
判断
返回一个含有布尔值的对象,True表示是缺失值:data.isnull()
删除
删除含有空缺值的行:data=data.dropna()
删除全为NaN的行:data=data.dropna(how='all')
删除全为NaN的列:data=data.dropna(axis=1,how='all')
填充
将缺失值替换为常数值0:data=data.fillna(0)或fata.fillna(0,inplace=True),不产生新的副本,直接修改源数据
用字典不同列填充不同的值:data=data.fillna({1:0.1,2:3}) #1列填充0.1,2列填充3