python dataframe dropna_python pandas DataFrame.dropna用法及代碼示例

本文详细介绍了如何使用Python pandas库的dropna()函数来处理数据框中的缺失值。该函数允许根据指定的轴(行或列)、缺失值的条件(任意或全部)以及阈值来删除含有缺失值的行或列。通过示例展示了如何删除至少有一个、所有或至少两个非缺失值的行,并选择特定列进行操作。此外,还演示了在原地修改数据框的操作。
摘要由CSDN通过智能技术生成

刪除缺失的值。

看到用戶指南詳細了解哪些值被認為缺失,以及如何處理缺失的數據。

參數:

axis:{0 或 ‘index’, 1 或 ‘columns’}, 默認為 0確定是否刪除包含缺失值的行或列。

0或‘index’:刪除包含缺失值的行。

1或‘columns’:刪除包含缺失值的列。

在1.0.0版中進行了更改:通過元組或列表以在多個軸上放置。隻允許一個軸。

how:{‘any’, ‘all’}, 默認為 ‘any’當我們擁有至少一個NA或全部NA時,確定是否從DataFrame中刪除行或列。

‘any’:如果存在任何NA值,請刪除該行或列。

‘all’:如果所有值均為NA,則刪除該行或列。

thresh:int, 可選參數要求許多非NA值。

subset:array-like, 可選參數沿其他軸考慮的標簽,例如如果要刪除行,這些將是要包括的列的列表。

inplace:bool, 默認為 False如果為True,則執行就地操作並返回None。

返回值:

DataFrame帶有NA條目的DataFrame從中刪除。

例子:

>>> df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],

... "toy": [np.nan, 'Batmobile', 'Bullwhip'],

... "born": [pd.NaT, pd.Timestamp("1940-04-25"),

... pd.NaT]})

>>> df

name toy born

0 Alfred NaN NaT

1 Batman Batmobile 1940-04-25

2 Catwoman Bullwhip NaT

將行缺失至少一個元素。

>>> df.dropna()

name toy born

1 Batman Batmobile 1940-04-25

將列放在至少缺少一個元素的地方。

>>> df.dropna(axis='columns')

name

0 Alfred

1 Batman

2 Catwoman

將所有元素都缺失的行刪除。

>>> df.dropna(how='all')

name toy born

0 Alfred NaN NaT

1 Batman Batmobile 1940-04-25

2 Catwoman Bullwhip NaT

僅保留至少具有2個非NA值的行。

>>> df.dropna(thresh=2)

name toy born

1 Batman Batmobile 1940-04-25

2 Catwoman Bullwhip NaT

定義在哪些列中查找缺失值。

>>> df.dropna(subset=['name', 'born'])

name toy born

1 Batman Batmobile 1940-04-25

將具有有效條目的DataFrame保留在同一變量中。

>>> df.dropna(inplace=True)

>>> df

name toy born

1 Batman Batmobile 1940-04-25

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值