批量提取关键字所在段落,word魔方插件高效完成

需求:

提取文档中某些关键字所在的整段内容。

例如:我想提取文档中关键字【老龄化】所在的所有段落内容。

工具:

Word魔方

操作步骤:

将关键字挨个录入提取条件,然后点击【开始提取】。

操作视频演示:

结果展示:

 

插件支持多个文档、多个关键字批量提取。并且支持提取之后,标识关键字。

代码借鉴:

    '运行中的对象Set WordApp = GetObject(, "Word.Application")
    '创建新对象Set WordApp = CreateObject("Word.Application")
Sub 方法1()
    Set doc = CreateObject("word.application")
    doc.Visible = True
    Set wd = doc.Documents.Add
    rrow = ThisWorkbook.Worksheets(1).Range("a65536").End(3).Row
    For i = 2 To rrow
        wd.Paragraphs.Add
        wd.Paragraphs(i).Range.Text = ThisWorkbook.Worksheets(1).Cells(i, 3).Value
        ' Selection.Range.ListFormat.ListString'光标当前所在段落
    Next
    wd.SaveAs ThisWorkbook.Path & "\例子.docx"
End Sub

Sub 方法2()
    Set doc = CreateObject("word.application")
    doc.Visible = True
    Set wd = doc.Documents.Add
    rrow = ThisWorkbook.Worksheets(1).Range("a65536").End(3).Row
    For i = 2 To rrow
       With doc.Selection
           .TypeText ThisWorkbook.Worksheets(1).Cells(i, 3).Value
           .TypeParagraph
        End With
    Next
    wd.SaveAs ThisWorkbook.Path & "\例子.docx"
End Sub

Sub 方法3()
'复制粘贴
End Sub




批量提取Word关键字段落可以使用Python中的python-docx库来实现。以下是一个简单的示例代码: ```python import docx def extract_keyword_paragraphs(doc_path, keyword): doc = docx.Document(doc_path) keyword_paragraphs = [] for paragraph in doc.paragraphs: if keyword in paragraph.text: keyword_paragraphs.append(paragraph.text) return keyword_paragraphs doc_path = "sample.docx" keyword = "关键字" keyword_paragraphs = extract_keyword_paragraphs(doc_path, keyword) for paragraph in keyword_paragraphs: print(paragraph) ``` 首先,我们需要导入python-docx库。然后,定义一个`extract_keyword_paragraphs`函数来提取关键字段落。这个函数接受两个参数:`doc_path`表示Word文档的路径,`keyword`表示要提取关键字。在函数内部,我们使用`docx.Document`来打开Word文档,然后遍历所有段落(`doc.paragraphs`),并检查每个段落中是否包含关键字。如果包含,将该段落加入到`keyword_paragraphs`列表中。最后,返回提取到的关键字段落。 接下来,我们指定要提取关键字段落Word文档路径和关键字,并调用`extract_keyword_paragraphs`函数进行提取。最后,我们遍历提取到的关键字段落列表,并逐行打印出来。 请注意,这只是一个简单的示例,实际应用中可能还需要根据具体需求进行进一步处理和优化,比如处理表格中的字段落提取其他格式的文本等。另外,需要安装python-docx库,可以使用`pip install python-docx`命令进行安装。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值