Python自动识别word文档中的关键字并标亮

from docx import Document
from docx.enum.text import WD_COLOR_INDEX  # 用于高亮颜色

def highlight_keywords(doc_path, keywords, output_path):
    # 打开现有文档
    doc = Document(doc_path)

    # 遍历文档中的所有段落
    for para in doc.paragraphs:
        for keyword in keywords:
            if keyword in para.text:
                inline = para.runs  # 获取段落中的所有 "run"
                for run in inline:
                    if keyword in run.text:
                        # 将关键字前后的文本分开
                        parts = run.text.split(keyword)
                        # 清除当前 run 的文本
                        run.text = parts[0]  # 保留关键字前的文本

                        # 插入高亮的关键字和后续的文本
                        for part in parts[1:]:
                            # 插入高亮的关键字
                            highlight = para.add_run(keyword)
                            highlight.font.highlight_color = WD_COLOR_INDEX.YELLOW  # 黄色高亮
                            # 插入关键字后的文本
                            after_keyword = para.add_run(part)

    # 保存修改后的文档
    doc.save(output_path)

# 使用示例
doc_path = r"E:\目标文件路径.docx"  # 输入的文档路径
keywords = ["关键词1", "关键词2"]  # 需要高亮的多个关键字
output_path = r"E:\文件输出路径.docx"  # 输出的文档路径

highlight_keywords(doc_path, keywords, output_path)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值