python去掉文本行_python删除文本中行数标签的方法

最新推荐文章于 2023-06-05 17:36:43 发布

weixin_39692172

最新推荐文章于 2023-06-05 17:36:43 发布

阅读量173

点赞数

文章标签： python去掉文本行

问题描述：

我们在网上下载或者复制别人代码的时候经常会遇到下载的代码中包含行数标签的情况。如下图：

这些代码中包含着行数如1.，2.等，如果我们想直接运行或者copy代码需要自己手动的删除这些标签。既然学了python，我们写一段脚本来处理它吧。

思路分析：

首先，我们逐行的读取文本。

利用正则表达式，可以顺利地匹配出所有的这些标签以及后面跟随的“\t”，正则表达式为：“\d+.\t”。

接着我们将匹配的结果在这一行中删除它，使用string模块的replace方法，将匹配的结果用‘'代替。

最后，我们保存每次删除了行数标签的结果行，然后将这些行写入原文本。注意，以w的方式打开文本会删除原文本内容。

代码：

# -*- coding:utf-8 -*-

import re

import os

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

ls = os.linesep

label_regex = r'\d+.\t'

content = []

for line in open('source.txt', 'r'):

mm = re.search(label_regex, line)

if mm:

mm = mm.group()

content.append(line.replace(mm, '').rstrip())

else:

break

f = open('source.txt', 'w')

f.writelines(['%s%s' % (x,ls) for x in content])

结果：

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

weixin_39692172

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。