【Pandas】使用pandas删除0较多的一行数据

在这里插入图片描述
如上excel表格,利用pandas读取数据:

import pandas as pd

# 读取excel
data = pd.read_excel('data.xlsx')
print(data.columns)

在这里插入图片描述
在这里插入图片描述
我们可以看到第3行和第5行数据0比较多,现在我们想删除这2行,如何实现呢?

首先,统计每行数据0的个数:

# 统计每行0的个数
sums = (data==0).astype(int).sum(axis=1)

在这里插入图片描述

然后,筛选出符合条件的行索引:

# 获取符合条件的行索引
sums_result = list(sums[sums>4].index)

在这里插入图片描述

最后,删除行索引的数据:

# 删除0超过n个的数据
data_final = data.drop(sums_result, axis=0)

删除后的数据:

在这里插入图片描述

写入excel:

# 写入excel
data_final.to_excel("data_final.xlsx",index=False)

在这里插入图片描述

所有源码如下:
python版本3.9.0
pandas版本1.4.2

# -*- coding: utf-8 -*-
"""
Created on Mon Apr 18 15:27:22 2022

@author: zqq
"""


import pandas as pd

# 读取excel
data = pd.read_excel('data.xlsx')
print(data.columns)

# 手动生成数据
# data = pd.DataFrame({'a':[1,5,0,3,0], 'b':[3,7,0,6,0], 'c':[5,0,0,7,1], 
#                      'd':[7,5,0,8,0], 'e':[9,2,7,1,0], 'f':[0,1,0,2,0]})

# 统计每行0的个数
sums = (data==0).astype(int).sum(axis=1)
# 获取符合条件的行索引
sums_result = list(sums[sums>4].index)
# 删除0超过n个的数据
data_final = data.drop(sums_result, axis=0)

# 写入excel
data_final.to_excel("data_final.xlsx",index=False)

参考资料:
https://www.cnblogs.com/hongbiao/p/16097801.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器不学习我学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值