pandas删除缺失数据(pd.dropna()方法)

1.创建带有缺失值的数据库:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])        # 随机产生5行3列的数据    
df.ix[1, :-1] = np.nan        # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan

print('\ndf1')        # 输出df1,然后换行
print(df)        

查看数据内容:

 

2.通常情况下删除行,使用参数axis = 0,删除列的参数axis = 1,通常不会这么做,那样会删除一个变量。

print('\ndrop row')
print(df.dropna(axis = 0))

 删除后结果:

转载于:https://www.cnblogs.com/keye/p/7722612.html

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pd.dropna() 是 pandas的一个函数,用于删除数据缺失值(NaN)。它可以应用于 pandas 的 DataFrame 或 Series 对象。 当应用于 DataFrame 对象时,pd.dropna() 将删除包含缺失值的整行或整列。默认情况下,它会删除包含任何缺失值的整行,但也可以通过指定 axis 参数来删除整列。此外,还可以通过设置 how 参数来控制删除的方式。 当应用于 Series 对象时,pd.dropna() 将删除包含缺失值的元素。 下面是一些常用的参数和用法: - axis:指定删除的轴向,0 表示删除整行,1 表示删除整列,默认为 0。 - how:指定删除的方式,可选值为 'any' 和 'all'。'any' 表示只要存在缺失值删除,'all' 表示只有全部是缺失值删除,默认为 'any'。 - subset:指定要考虑的列或行的标签,可以是单个标签或标签列表。 示例代码如下: ```python import pandas as pd # 创建一个包含缺失值的 DataFrame data = {'A': [1, 2, None, 4], 'B': [5, None, 7, 8], 'C': [9, 10, 11, 12]} df = pd.DataFrame(data) # 删除包含缺失值的整行 df_dropna = df.dropna() print(df_dropna) # 删除包含缺失值的整列 df_dropna_col = df.dropna(axis=1) print(df_dropna_col) # 删除全部是缺失值的整行 df_dropna_all = df.dropna(how='all') print(df_dropna_all) # 删除指定列包含缺失值的整行 df_dropna_subset = df.dropna(subset=['B', 'C']) print(df_dropna_subset) ``` 输出结果如下: ``` A B C 0 1.0 5.0 9 2 NaN 7.0 11 3 4.0 8.0 12 C 0 9 1 10 2 11 3 12 A B C 0 1.0 5.0 9 1 2.0 NaN 10 2 NaN 7.0 11 3 4.0 8.0 12 A B C 0 1.0 5.0 9 2 NaN 7.0 11 3 4.0 8.0 12 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值