pandas用众数填充缺失值_入门|零基础《python科学库之pandas》如何处理缺失值(一)?...

前言:

在处理数据的时候你会发现某些数据丢失,这种情况怎么办呢?Pandas 提供了一些方法来发现、剔除、替换数据结构中的缺失值,主要包括以下几种。

  • 创建一个布尔类型的掩码标签缺失值。

isnull()

  • 与 isnull() 操作相反。

notnull()

  • 返回一个剔除缺失值的数据。

dropna()

  • 返回一个填充了缺失值的数据副本。

fillna()

一、处理series对象

  • 通过dropna滤除缺失数据:
data= pd.Series([1, np.nan, 'hello', None])print(data)data.dropna()

代码结果:

0 11 NaN2 hello3 Nonedtype: object0 12 hellodtype: object
  • 通过布尔类型掩码也能滤除缺失对象:
data[data.notnull()]

代码结果:

0 12 hellodtype: object

二、处理DataFrame对象:

在处理DataFrame上使用它们时需要设置一些参数

df= pd.DataFrame([[1, np.nan, 2], [2, 3, 5], [np.nan, 4, 6]])df

​代码结果:

3f04f204845005b5f3e7fdb29cd9d1f0.png
  • 默认情况下,dropna() 会剔除所有包含NaN的行或列:
df.dropna()

代码结果:

93ee9fb9bc931d985570a2afcdbf6681.png
  • dropna() 默认设置是 how='any'​,过滤掉全部为NaN的行或列:
​df.dropna(axis='columns', how='all')

​代码结果:

04804a23e950a64f2d427c3c15700ccb.png
  • 设置按不同的坐标轴剔除缺失值,比如 axis=1(或 axis='columns')会剔除任何包含 缺失值的整列数据
df.dropna(axis='columns')

​代码结果:

f35bbc54b65692eb6e78794b5dad249a.png
  • 传入thresh=n过滤掉n行或列:
df.dropna(axis='rows', thresh=3)

代码如下:

67449e376928dbb7704c110dbac6b18f.png

fillna()的参数比较多,单独放到下一次讲,如果有什么地方说的不好,欢迎在下面评论留言,如果觉得还可以,可以点击右上角的关注➕转发,私信回复python领取,学习资料一份,如果你想要其他资料也可以私信哦。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值