Pandas 数据处理(一)缺失值处理
缺失值处理
缺失值详细位置
data.isnull()
有缺失值的特征列
data.isnull().any()
提取出有缺失值的行
data[data.isnull().values==True]
缺失值删除
data.dropna(how='any',axis=0,inplace=True)
how : {‘any’, ‘all’},‘any’:如果存在任何NA值,则删除该行或列。‘all’:如果所有值均为NA,则删除该行或列
axis : 0或’index’:删除包含缺失值的行,1或“columns”:删除包含缺失值的列。
inplace : bool, 默认False,如果为True,则直接替换并返回None。
缺失值填充
众数填充
data.fillna(data.mode())
均值填充
data.fillna(data.mean())
向上取值填充
data.fillna(method='ffill')
data.fillna(method='pad')
向下取值填充
data.fillna(method='bfill')
data.fillna(method='pad')
中位数填充
data.fillna(data.median())
自定义值填充(0为例)
data.fillna(0)
正在做比赛,记录一下免得遗忘