下面是一个示例代码,用于提取txt文本中的章节:
import re
# 定义章节标题的正则表达式
pattern = re.compile(r'第[一二三四五六七八九十百千万壹贰叁肆伍陆柒捌玖拾佰仟]{1,6}章')
# 读取txt文件内容
with open('book.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 查找所有匹配的章节标题
for match in pattern.finditer(content):
print(match.group())
这段代码使用正则表达式来查