pandas数据清洗 缺失值与空值处理

数据清洗之前,我们必须先明白自己想要干什么,达成怎么样的效果,然后采取对应的方法来实现这个需求。
以下是对数据一些清洗方法介绍:

1. 查看空值

DataFrame.isna()

  • DataFrame.isna()判断该表的空值情况
  • DataFrame.isna().sum()汇总该表空值情况的个数
  • DataFrame.isna().sum().sort_values(ascending=False)按空值个数降序显示

2. 丢弃空值

DataFrame.dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)
丢弃空值:

  • axis =0,丢弃含有空值的行;=1,丢弃含有空值的列。
  • how ='any',(行或列)只要有元素为空,就(整行或整列)丢弃;='all',(行或列)必须满足所有值都为空值,才丢弃(整行或整列)。
  • thresh =10,丢弃空值个数大于10的行或者列
  • subset =['a','b'],a列(行)或者b列(行)中有空值就丢弃该列(行)。(指定在哪些区域操作,不指定默认是全表)
  • inplace = False,生成副本,原表不做改变;=True,在原表里面做出改变

3. 填充空值

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None)

  • value =0,用0填充空值。
  • method ='ffill',用空值前面的数值填充空值;='bfill',用空值后面的数值填充空值。(和value参数不能共用)。
  • asis ='0',代表行;='1',代表列。
  • limit =10,只填充10个空值。
  • 后面不用管了。
  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值