from docx import Document from docx.enum.text import WD_COLOR_INDEX # 用于高亮颜色 def highlight_keywords(doc_path, keywords, output_path): # 打开现有文档 doc = Document(doc_path) # 遍历文档中的所有段落 for para in doc.paragraphs: for keyword in keywords: if keyword in para.text: inline = para.runs # 获取段落中的所有 "run" for run in inline: if keyword in run.text: # 将关键字前后的文本分开 parts = run.text.split(keyword) # 清除当前 run 的文本 run.text = parts[0] # 保留关键字前的文本 # 插入高亮的关键字和后续的文本 for part in parts[1:]: # 插入高亮的关键字 highlight = para.add_run(keyword) highlight.font.highlight_color = WD_COLOR_INDEX.YELLOW # 黄色高亮 # 插入关键字后的文本 after_keyword = para.add_run(part) # 保存修改后的文档 doc.save(output_path) # 使用示例 doc_path = r"E:\目标文件路径.docx" # 输入的文档路径 keywords = ["关键词1", "关键词2"] # 需要高亮的多个关键字 output_path = r"E:\文件输出路径.docx" # 输出的文档路径 highlight_keywords(doc_path, keywords, output_path)