DataFrame 利用all()和any()筛选删除 全为0的行列

#方法1
#筛选全为0的行,得到的 df 不含全为0的行
df = df.loc[~(df==0).all(axis=1)]
 
#筛选不全为0的行,得到的 df 都是全为0的行
df.loc[(df==0).all(axis=1)]
 
df.loc[(df!=0).any(1)]

实例

df 数据集

import pandas as pd
import numpy as np
df = pd.DataFrame({'x': ['A', 'C', 'B', 'D', 'C', 'B', 'B', 'A', 'D'], 
                   'num': [np.nan, 23, np.nan, 54, 0, 1, 8, 9, 12], 
                   'a': [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan]})
df
Out[3]: 
   x   num   a
0  A   NaN NaN
1  C  23.0 NaN
2  B   NaN NaN
3  D  54.0 NaN
4  C   0.0 NaN
5  B   1.0 NaN
6  B   8.0 NaN
7  A   9.0 NaN
8  D  12.0 NaN

查找存在0或全是0的列并返回列名

  • df 中存在 0 的列名
df.loc[:, (df == 0).any()].columns

Out[4]: Index(['num'], dtype='object')
  • df 中全是 0 的 列名
df.loc[:, (df == 0).all()].columns
Out[5]: Index([], dtype='object')

缺失值查找、处理

  • 取出 df全是缺失值的列
df.loc[:, df.isnull().all()].columns
Out[6]: Index(['a'], dtype='object')
  • 取出 df存在缺失值的列
df.loc[:, df.isnull().any()].columns
Out[7]: Index(['num', 'a'], dtype='object')
  • python 中自带函数对 df 的缺失值删除处理。
df.dropna(axis=0)   # 删除df中存在缺失值的行
df.dropna(axis=1)  # 删除df中存在缺失值的列
df.fillna(0)  # 将所有缺失值填补为0
  • 剔除 dfnum 列中为空值的行
df.loc[df['num'].notnull(), :]
Out[13]: 
   x   num   a
1  C  23.0 NaN
3  D  54.0 NaN
4  C   0.0 NaN
5  B   1.0 NaN
6  B   8.0 NaN
7  A   9.0 NaN
8  D  12.0 NaN
  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值