pandas 中空值处理

最新推荐文章于 2024-08-03 11:21:01 发布

锲启

最新推荐文章于 2024-08-03 11:21:01 发布

阅读量891

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44166997/article/details/88698063

版权

一. 相关函数

df.dropna()

df.fillna()

df.isnull() ( df.isna() )

df.notnull()

二. 具体解释

1. df.dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

函数作用：删除含有空值的行或列

axis：维度，axis=0表示index行,axis=1表示columns列，默认为0

how："all"表示这一行或列中的元素全部缺失（为nan）才删除这一行或列，"any"表示这一行或列中只要有元素缺失，就删除这一行或列

thresh：一行或一列中至少出现了thresh个才删除。

subset：当axis=0时，给定列的索引组成的列表subset = [ ]，这些列中存在空值则删除空值所在的行（当axis=1时相反）

inplace：刷选过缺失值得新数据是存为副本还是直接在原数据上进行修改。

除了上述方法你也可以直接填充常数或字典来填充缺失值

例：df.fillna(0) , df.fillna({‘列标’：填充值})

2. df.fillna( [‘value=None’, ‘method=None’, ‘axis=None’, ‘inplace=False’, ‘limit=None’, ‘downcast=None’, ‘**kwargs’],）

函数作用：填充缺失值

value：需要用什么值去填充缺失值

axis：确定填充维度，从行开始或是从列开始

method：插值方法，如果没有其他参数，默认是‘ffill’ ffill:用缺失值前面的一个值代替缺失值，如果axis =1，那么就是前一列该位置的值替换后面的缺失值，如果axis=0，那么则是前一排该位置的值替换下面的缺失值。backfill/bfill，缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现

limit：确定每列可填充的个数，如果limit=2，则每列只填充两个缺失值。

3. df.isnull() 或 df.isnull()

函数作用：判断是不是缺失值

df.isnull.sum() ：用于统计缺失值个数

4. df.notnull()

函数作用：同上

df.isnull.sum() ：用于统计非缺失值的个数

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。