【openpyxl操作excel】按给定条件删除行

因为工作需求,需要从一个4万多行的excel文件中筛选出一些行删掉。
因为人生钱少苦短 我必须得用免费python。
稍稍研究了一下,openpyxl官网内容实在潦草,而网友们的分享也是杂七杂八,参考价值不大。
最后成果如下,可用好用,代码简单,分享一下是为记:

#coding:utf-8
import openpyxl
wb=openpyxl.load_workbook(filename='xxxxxx.xlsx')
ws=wb.active
for i in range(1,ws.max_row,1): #从第一行开始到最后一行逐行进行
    if ws.cell(row=i,column=1).value=='序号': #如果该行第一列值为‘序号’
        ws.delete_rows(i) #则删除该行
        print('删除第-',i,'-行成功!')
wb.save(filename='yyyyyyy.xlsx')

以上操作,openpyxl是将数据一次性加载到内存后再处理,excel文件占用内存大小约为原始文件大小的50倍,即50MB文件需要占用2.5GB内存,大概是这么个关系,请学弟学妹使用之前心里要有个数。

【2020-11-22更新】
网友‘传说啊哈哈哈’说得没错,原程序是有所述的问题,大意!该网友的思路是一种方法,网络上还有一种方法是复制所需要的行到另外一张表,不需要的行不复制,最后保存为原文件名,覆盖原文件。
总觉得这些方法有些“苟且”,太绕!经过不懈的‘研究’,在国外一位高人的帖子里终于给我找到了最直接的解决之法,写成代码如下:

#coding:utf-8
import openpyxl
wb=openpyxl.load_workbook(filename='xxxxxx.xlsx')
ws=wb.active
row_number=0
for row in ws.iter_rows():#迭代遍历每行
	if row[1].value=='序号':#给定的条件,读者可根据自身需求自定义
		row_number=row[1].row#关键步骤!获得当前行的行号!
		ws.delete_rows(row_number)
wb.save(filename='yyyyyyy.xlsx')
wb.close		

这段代码利用迭代器,比较简单直接。其中最关键的信息是通过row[1].row获得当前行的行号,这是目前网络上所有解决方案中没有提及的方法,除了这位“高人”。原帖中,似乎他的意见也被大家忽视了,我其实也是抱着将信将疑的态度用代码试了下row[1].row,确实可以获得当前行的行号,返回的数据类型是int。
回过头,我又去翻了翻openpyxl官网的文件,没有找到相关的语法信息,心有不甘,但是时间有限,如果有哪位码友有相关信息,请分享给大家。

【发表是最好的记忆】

  • 9
    点赞
  • 54
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 22
    评论
评论 22
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

狮弟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值