pandas_空值清洗

知识点:

1. None类型为NoneType, np.nan类型为float

2. 在pandas中如果遇到None形式的控制则pandas会将其转成NAN的形式

以下三种方式的目标是删除包含空值的行

目录

方式一 

 方式二

方式三

 ​


import pandas as pd
import numpy as np
type(None)
# out: NoneType
type(np.nan)
# out: float

方式一 

# 方式一  isnull  any
df = pd.DataFrame(data=np.random.randint(0,100,size=(8,6)))
df.iloc[2,3] = None
df.iloc[4,4] = np.nan
df.iloc[5,2] = None
df

df.isnull()

 

df.isnull().any(axis=1) # 检查行

df.isnull().any(axis=0) # 检查列

 

drop_index = df.loc[df.isnull().any(axis=1)].index
drop_index
# out: Int64Index([2, 4, 5], dtype='int64')
df.drop(labels=drop_index,axis=0) # 删除缺失的行

 

 方式二

# 方式二  notnull all
df

 

df.notnull()

df.notnull().all(axis=1) # 检查行

 

df.notnull().all(axis=0) # 检查列

df.loc[df.notnull().all(axis=1)] # 删除缺失的行

 

方式三

# 方式三 dropna
df

 

df.dropna(axis=0) # 删除缺失的行

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Pandas 中可以使用以下方法来判断空值: 1. `df.isnull()`:返回一个布尔类型的数据框,表示各个位置是否是空值。 2. `df.isna()`:与 `df.isnull()` 等价。 3. `df.notnull()`:与 `df.isnull()` 相反,返回一个布尔类型的数据框,表示各个位置是否不是空值。 例如: ```python import pandas as pd df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]}) print(df.isnull()) print(df.notnull()) ``` 输出: ``` A B C 0 False False False 1 False True False 2 True False False 3 False False False ``` ``` A B C 0 False True False 1 False False True 2 True True True 3 False True True ``` ### 回答2: Pandas是一个用于数据分析的Python库,它提供了用于处理和分析大型数据集的函数和数据结构。在Pandas中,我们可以使用多种方法来判断数据集中的空值。 首先,我们可以使用isnull()函数来判断数据集中的每个元素是否为空值。这个函数会返回一个与数据集相同大小的布尔型数组,其中的每个元素对应的是其在原数据集中是否为空值。如果元素为空值,返回True,否则返回False。 另外,我们也可以使用notnull()函数来判断数据集中的每个元素是否为非空值。这个函数与isnull()函数的功能相反,会返回一个布尔型数组,其中的每个元素对应的是其在原数据集中是否为非空值。 除了可以判断整个数据集中的元素是否为空值之外,我们还可以使用any()和all()函数来进行更细致的判断。any()函数会返回一个布尔值,用于判断整个数据集中是否存在空值。如果存在空值,返回True,否则返回False。 另外,all()函数也会返回一个布尔值,用于判断整个数据集中的所有元素是否都为空值。如果所有元素都为空值,返回True,否则返回False。 最后,我们还可以使用dropna()函数来删除数据集中的空值。这个函数会返回一个新的数据集,其中所有含有空值的行或列都将被删除。 总结起来,Pandas提供了多种方法来判断数据集中的空值,包括isnull()、notnull()、any()和all()等函数。我们可以根据具体的需求选择合适的方法来进行判断和处理。 ### 回答3: 在pandas中,可以使用isnull()函数来判断一个数据集中的空值。isnull()函数会将数据集中的每个元素进行判断,如果是空值,则返回True;否则,返回False。 例如,我们有一个数据集df,其中包含了一列“年龄”,我们想要判断这一列中是否存在空值,可以使用df['年龄'].isnull()。这个操作会返回一个布尔类型的Series,表示每个元素是否为空值。 我们也可以使用notnull()函数来判断非空值。notnull()函数和isnull()函数的使用方法相同,只是返回True的是非空值,返回False的是空值。 此外,我们还可以使用any()函数来判断整个数据集中是否存在空值。例如,df.isnull().any()会返回一个布尔类型的Series,表示每一列中是否存在空值。如果某一列中存在空值,则对应位置为True;如果某一列中没有空值,则对应位置为False。 需要注意的是,pandas将不同类型的空值都视为缺失值,包括NaN(浮点型空值)、NaT(时间数据类型空值)等。在数据分析中,判断和处理空值是非常重要的,可以通过这些空值判断函数来帮助我们进行有效的数据清洗和处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值