如题,问题很简单,假如有一个很长的txt文档,每一段都有一个数字编号,但是这个编号是不连续的,现在想把所有的编号都去掉,然后重新按顺序编号。
直接上代码
import re
with open('./text.txt', 'r', encoding='utf-8') as f:
# 以回车符为标志,读取所有的段落,变成一个列表read_lines
read_lines = f.readlines()
# 遍历read_lines里的第一个段落,然后用正则表达式方法去掉段落开头的数字和符号
n = 1
for line in read_lines:
# 去掉数字和顿号,如:“23、”
line = re.sub('[\d+、]', '', line)
# 去掉数字和点号,如:“23.”
line = re.sub('[\d+.]', '', line)
# 去掉反括号,如:“)”,也可能是一对圆括号(),自己看结果的情况修改
line = re.sub('[)]', '', line)
# print(line)
# 把修改后的每一个段落重新写入一个文件。
with open('./text_new.txt', 'a', encoding='utf-8') as file:
file.write(f"{n}、{line}")