这是一个示例代码,可以帮助您抽取 doc 文件中含有多个特定关键词其中一个的句子,并保存这些含有关键词的句子到 txt 文件:
import re
import docx# 读取 doc 文件
doc = docx.Document('文件路径')
# 要抽取的关键词列表
keywords = ['关键词1', '关键词2', '关键词3']
# 用于存储抽取到的句子
sentences = []
# 遍历所有段落
for paragraph in doc.paragraphs:
# 获取段落文本
text = paragraph.text