如何过滤word文档中指定颜色的文本内容

题主是一个略懂编程的编程爱好者,想通过自己的双手解决工作中的实际问题,处理一堆如下图的word文档,需要将红色部分的文字删掉,如果只是一两个文件就罢了,但是每天都要处理大量的文档,人工来搞实在头大。

先说下使用的软件:UiFox,自己百度就能找到下载,不多介绍

下面是我写的代码,逻辑大概就是这样的,有没有大神给个更好的思路,这种方式能达到效果,但是我觉得应该还可以更高效,求带

/* 定义函数,删除过滤word文档中指定颜色的文字
    入参:
        workbookPath:word文档文件路径,如 "d:\\temp.docx"
        RGB_Decimal:目标10进制RGB颜色值,如要过滤红色文字,填写 255
    出参:
        无
*/
def FilterColor(workbookPath,RGB_Decimal)  
    // 定义需要使用到的变量,养成好习惯,变量使用先定义
    var objWord, lenChar,color,sRet,textResult
    // 打开指定word文件,在可视化界面配置参数更方便
    objWord = word.Open(workbookPath, "word", True, "", "") 
    word.SetCursor(objWord, 1, "char") // 将光标定位在文本开头位置
    lenChar = len(Word.ReadAll(objWord)) // 获取整篇文档字符数
    // 这段循环的目的,选中每一个字符,并且对字符进行判断,最终处理成我们要的结果
    for i = 1 To lenChar
        word.CustomSelect(objWord, 1, "char", "backward") // 向后选中一个字符
        color = word.SelGetTextStyle(objWord, "color") // 获取选中文本的颜色
        // 判断当前选中文字颜色值是否为我们要过滤的颜色,如果条件成立,则对字符进一步判断,最终删除符合过滤条件的字符
        if color = RGB_Decimal 
            sRet = Word.SelOperation(objWord, "read") // 读取选中字符的内容
            // 这一步是为了匹配表格标识符,如果遇到表格标识符,并且不做这一步处理,会导致光标卡住,无法对后续内容做处理
            textResult = Text.Extract(sRet, "\r\\x07", true, false) 
            // 当前字符内容如果是:表格标识符、或者空格,则跳过当前字符,继续处理下一个字符
            if textResult != "" or sRet = " "
                continue
            end if
            // 经过层层处理,到这一步就说明当前字符是我们要过滤的内容,使用下面这条命令,删除即可
            Word.SelOperation(objWord, "backspace")
        end if
    next
    // 到这一步,我们的处理就完成了,后面是要保存、关闭文档,只需要调用对应的命令即可(小技巧,既要保存又要关闭,可以单独使用下方的第二条命令)
    // 这是保存命令,不填写路径则保存原文件,否则会执行另存为
    Word.Save(objWord, "")     
    // 这是关闭命令,第二个参数是否保存原文件,第三个参数是否关闭所有已经打开的word文档
    Word.Close(objWord, true, false)  
end def

源码对应的可视化代码,通过右侧的参数面板即可对命令中的参数进行快速设置,挺适合小白

写在最后,仔细看了下文章发表后的效果,代码里面的高亮有点奇怪,原因是他们的语法是自己弄的,需要在他们的客户端里面才能正常高亮。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
如果在插入图片后发现原有文本颜色变黑了,可能是因为在创建 `XWPFRun` 对象时没有设置正确的文本样式。你可以在创建文本对象时指定一个新的样式,以确保文本颜色和字体等属性不会受到影响。以下是修改后的示例代码: ```java import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.poi.xwpf.usermodel.*; public class InsertImageInWord { public static void main(String[] args) throws Exception { // 创建 Word 文档对象 XWPFDocument document = new XWPFDocument(new FileInputStream("example.docx")); // 创建图片对象,并读取图片文件 XWPFPictureData pictureData = document.addPictureData(new FileInputStream("image.jpg"), XWPFDocument.PICTURE_TYPE_JPEG); // 创建段落对象,并设置段落样式 XWPFParagraph paragraph = document.createParagraph(); paragraph.setAlignment(ParagraphAlignment.CENTER); // 创建文本对象,并插入图片 XWPFRun run = paragraph.createRun(); run.setText("这是一张图片:"); run.addBreak(); // 创建新的文本样式对象 XWPFStyle style = document.createStyle(); style.setColor("000000"); // 设置字体颜色为黑色 style.setFontSize(12); // 设置字体大小为12磅 // 将新的样式对象应用到文本对象 run.getCTR().addNewRPr().setRStyle(style.getStyleId()); run.addPicture(pictureData, Document.PICTURE_TYPE_JPEG, "image.jpg", Units.toEMU(200), Units.toEMU(200)); // 保存 Word 文档 document.write(new FileOutputStream("example.docx")); document.close(); } } ``` 在这个例子,我们创建了一个新的文本样式对象 `style`,并将其应用到文本对象 `run` ,以确保文本样式不会受到图片的影响。注意,新的样式对象需要先添加到文档,才能在文本对象使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值