这是一个完整的代码示例,它实现了您描述的功能。
首先,我们需要导入必要的库:
import os
import openpyxl
from docx import Document
然后,我们需要打开Excel文件,读取关键词列表:
# 读取Excel文件中的关键词列表
excel_file = 'keywords.xlsx'
wb = openpyxl.load_workbook(excel_file)
sheet = wb.active
keywords = [cell.value for cell in sheet['A']]
接下来,我们打开doc文件,并在其中查找带有关键词的句子。我们可以使用docx库来读取doc文件并遍历其中的每个段落:
# 打开doc文件,并查找带有关键词的句子
doc_file = 'document.docx'
document = Document(doc_file)
matched_sentences = []
for paragraph in document.paragraphs:
for keyword in keywords:
if keyword in paragraph.text:
matched_sentences.append(paragraph.text)
break
最后,我们将抽取的句子保存到txt文件中:
# 将抽取的句子保存到txt文件
output_file = 'output.txt'
with open(output_file, 'w') as f:
for sentence in matched_sentences:
f.write(sentence + '\n')
完整的代码如下所示:
```python import os import openpyxl from docx import Document
读取Excel文件中的关键词列表
excel_file = 'keywords.xlsx' wb = openpyxl.load_workbook(excel_file) sheet = wb.active keywords = [cell.value for cell in sheet['A']]
打开doc文件,并查找带有关键词的句子
doc_file = 'document.docx' document = Document(doc_file) matched_sentences = []