目录
一、缺失值处理
(1)判断缺失值
(data类型为series/dataframe)
data.isnull()
##返回布尔值对象,缺失值即为true.
data.notnull()
##isnull的否定形式
(2)去掉缺失值
data.dropna()
默认丢掉所有缺失值的行;
data.dropna(how='all')
##丢掉全部为na的行
data.dropna(how='any')
##丢掉只要含有na的行
date.dropna(axis=1,how='all')
##同理,丢弃全部为na的列传入axis=1即可)
data.dropna(thresh=n)
##每一行除去na值后如果剩下的数值>=n才显示
(3)填补缺失值
不想滤除缺失值,那就用其他数来填补:
data.fillna(0)
##最简单的就是括号里直接填写用来填补的值
data.fillna({1: 0.5, 2: 0})
##如果有不同列(比如不同特征)的空值要用不同值来填补,就用字典传输,1和2表示列;
data.fillna(data.mean())
##可以直接用计算得到的