pandas 中 dropna()函数

本文详细介绍Python pandas库中dropna()函数的作用,用于移除DataFrame中的NaN值行,包括参数axis、how、thresh和subset的使用,以及如何通过inplace参数在原数据上操作。通过实例演示了如何应用这些技巧来处理缺失值问题。
摘要由CSDN通过智能技术生成

dropna()函数的作用是去除读入的数据中(DataFrame)含有NaN的行。
如下:

>>> df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),
                            pd.NaT]})
>>> df
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

使用 dropna() 效果:

>>> df.dropna()
     name        toy       born
1  Batman  Batmobile 1940-04-25

注意:

在代码中要保存对原数据的修改,需要添加 inplace 参数 ,inplace=True 表示直接在原数据上更改

df.dropna(inplace=True)

例:

dfs = pd.read_excel(path, sheet_name='Sheet1',index_col='seq')  

dfs.dropna(inplace=True) #去除包含NaN 的行

print(dfs)#若不用inplace=True,此处 dfs 结果仍包含NaN

dropna 参数:

  1. axis: default 0指行,1为列

  2. how: {‘any’, ‘all’}, default ‘any’指带缺失值的所有行;'all’指清除全是缺失值的

  3. thresh: int,保留含有int个非空值的行

  4. subset: 对特定的列进行缺失值删除处理

  5. inplace: 这个很常见,True表示直接在原数据上更改

参考

  • 8
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值