【openpyxl操作excel】按给定条件删除行

最新推荐文章于 2024-05-06 15:03:20 发布

狮弟

最新推荐文章于 2024-05-06 15:03:20 发布

阅读量7.4k

点赞数 9

分类专栏： Python

本文链接：https://blog.csdn.net/weixin_43894266/article/details/106598328

版权

Python 专栏收录该内容

26 篇文章 2 订阅

订阅专栏

因为工作需求，需要从一个4万多行的excel文件中筛选出一些行删掉。
因为人生钱少苦短我必须得用免费python。
稍稍研究了一下，openpyxl官网内容实在潦草，而网友们的分享也是杂七杂八，参考价值不大。
最后成果如下，可用好用，代码简单，分享一下是为记：

#coding:utf-8
import openpyxl
wb=openpyxl.load_workbook(filename='xxxxxx.xlsx')
ws=wb.active
for i in range(1,ws.max_row,1): #从第一行开始到最后一行逐行进行
    if ws.cell(row=i,column=1).value=='序号': #如果该行第一列值为‘序号’
        ws.delete_rows(i) #则删除该行
        print('删除第-',i,'-行成功！')
wb.save(filename='yyyyyyy.xlsx')

以上操作，openpyxl是将数据一次性加载到内存后再处理，excel文件占用内存大小约为原始文件大小的50倍，即50MB文件需要占用2.5GB内存，大概是这么个关系，请学弟学妹使用之前心里要有个数。

【2020-11-22更新】
网友‘传说啊哈哈哈’说得没错，原程序是有所述的问题，大意！该网友的思路是一种方法，网络上还有一种方法是复制所需要的行到另外一张表，不需要的行不复制，最后保存为原文件名，覆盖原文件。
总觉得这些方法有些“苟且”，太绕！经过不懈的‘研究’，在国外一位高人的帖子里终于给我找到了最直接的解决之法，写成代码如下：

#coding:utf-8
import openpyxl
wb=openpyxl.load_workbook(filename='xxxxxx.xlsx')
ws=wb.active
row_number=0
for row in ws.iter_rows():#迭代遍历每行
	if row[1].value=='序号':#给定的条件，读者可根据自身需求自定义
		row_number=row[1].row#关键步骤！获得当前行的行号！
		ws.delete_rows(row_number)
wb.save(filename='yyyyyyy.xlsx')
wb.close

这段代码利用迭代器，比较简单直接。其中最关键的信息是通过row[1].row获得当前行的行号，这是目前网络上所有解决方案中没有提及的方法，除了这位“高人”。原帖中，似乎他的意见也被大家忽视了，我其实也是抱着将信将疑的态度用代码试了下row[1].row，确实可以获得当前行的行号，返回的数据类型是int。
回过头，我又去翻了翻openpyxl官网的文件，没有找到相关的语法信息，心有不甘，但是时间有限，如果有哪位码友有相关信息，请分享给大家。

【发表是最好的记忆】

狮弟

关注

9
点赞
踩
54

收藏

觉得还不错? 一键收藏
打赏
22
评论
【openpyxl操作excel】按给定条件删除行

因为工作需求，需要从一个4万多行的excel文件中筛选出一些行删掉。因为人生钱少苦短我必须得用免费python。稍稍研究了一下，openpyxl官网内容实在潦草，而网友们的分享也是杂七杂八，参考价值不大。最后成果如下，可用好用，代码简单，分享一下是为记：#coding:utf-8import openpyxlwb=openpyxl.load_workbook(filename='xxxxxx.xlsx')ws=wb.activefor i in range(1,ws.max_row,1):
复制链接

扫一扫