python中用正则去掉字符串开头的数字编号

kylner

已于 2022-08-25 07:45:22 修改

阅读量2.7k

点赞数 3

分类专栏： Python 文章标签： python 正则表达式

于 2022-06-21 01:04:34 首次发布

本文链接：https://blog.csdn.net/kylner/article/details/125383306

版权

Python 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

如题，问题很简单，假如有一个很长的txt文档，每一段都有一个数字编号，但是这个编号是不连续的，现在想把所有的编号都去掉，然后重新按顺序编号。
直接上代码

import re

with open('./text.txt', 'r', encoding='utf-8') as f:
	# 以回车符为标志，读取所有的段落，变成一个列表read_lines
    read_lines = f.readlines()
# 遍历read_lines里的第一个段落，然后用正则表达式方法去掉段落开头的数字和符号
n = 1
for line in read_lines:
	# 去掉数字和顿号，如：“23、”
    line = re.sub('[\d+、]', '', line)
    # 去掉数字和点号，如：“23.”
    line = re.sub('[\d+.]', '', line)
    # 去掉反括号，如：“)”，也可能是一对圆括号()，自己看结果的情况修改
    line = re.sub('[)]', '', line)
    # print(line)
    # 把修改后的每一个段落重新写入一个文件。
    with open('./text_new.txt', 'a', encoding='utf-8') as file:
        file.write(f"{n}、{line}")