Python数据处理工具——去除Excel文本中多余的空行,并且写入到原来的位置

前言

        在把爬虫爬到的数据存入Excel之后,有遇到过文本有很多空行的情况,在文章的中间和前面后面,如下图:

         我觉得Excel的替换又不好用,所以写了这么一个小工具去处理这样的一个格式的数据,省得自己一个个去去删(不现实别去干  )

代码如下:

# 去除Excel文本中多余的空行,并且写入到原来的位置
def remove_emptyrow(path=r'', rcolumn=1):  # path=路径,rcolum=要处理的列
    wb = openpyxl.load_workbook(path)  # 加载文件
    ws = wb.active
    for i in range(1, ws.max_row + 1):
        data = []
        old = ws.cell(i, rcolumn).value
        r = re.split(r'\s+', old)  # 去除文本中间的空行
        for j in r:  # 去除文本前后的空行
            if j == '':
                pass
            else:
                data.append(j)
        ws.cell(i, rcolumn).value = '\n'.join(data)  # 写入
    wb.save(path)  # 保存
    wb.close()
    print("处理完成")
remove_emptyrow()

         其实这代码不但会去删换行(\n),也可以把也可以把爬虫爬到的\t,\r,这种格式删除,其实很大一部分空行就是这些分隔符引起的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值