POI 替换word文档书签

word按照版本为两种:doc和docx,POI针对这两种操作需要不同的API:

 

doc操作使用HWPFDocument,替换思想就是找到书签的起止位置,对范围内的文本进行替换:

public static void docOperate(InputStream inputStream,OutputStream outputStream,
                                  Map<String,String> dataMap) throws IOException {

        HWPFDocument document = new HWPFDocument(inputStream);
        Bookmarks bookmarks = document.getBookmarks();
        for(int dwI = 0;dwI < bookmarks.getBookmarksCount();dwI++){
            Bookmark bookmark = bookmarks.getBookmark(dwI);
            if(dataMap.containsKey(bookmark.getName())){
                Range range = new Range(bookmark.getStart(),bookmark.getEnd(),document);
                range.replaceText(dataMap.get(bookmark.getName()),false);
            }
        }
        document.write(outputStream);
    }

docx 操作使用 XWPFDocument,替换思想是根据段落找到书签,然后取书签起止范围内的节点进行操作,目的就是将书签起止范围内的多个文字节点删除,然后添加新的文本内容;此时可将文本插入或替换在书签的前、中、后等位置,因书签原内容已删,效果其实是一样的:

/** docx中定义的部分常量引用  **/
    public static final String RUN_NODE_NAME = "w:r";
    public static final String TEXT_NODE_NAME = "w:t";
    public static final String BOOKMARK_START_TAG = "w:bookmarkStart";
    public static final String BOOKMARK_END_TAG = "w:bookmarkEnd";
    public static final String BOOKMARK_ID_ATTR_NAME = "w:id";
    public static final String STYLE_NODE_NAME = "w:rPr";



public static void docxOperate(InputStream inputStream,OutputStream outputStream,Map<String,String> dataMap) throws IOException {
        XWPFDocument document = new XWPFDocument(inputStream).getXWPFDocument();
        List<XWPFParagraph> paragraphList =  document.getParagraphs();
        for(XWPFParagraph xwpfParagraph:paragraphList){
            CTP ctp = xwpfParagraph.getCTP();

            for(int dwI = 0;dwI < ctp.sizeOfBookmarkStartArray();dwI++){
                CTBookmark bookmark = ctp.getBookmarkStartArray(dwI);
                if(dataMap.containsKey(bookmark.getName())){

                    XWPFRun run = xwpfParagraph.createRun();
                    run.setText(dataMap.get(bookmark.getName()));

                    Node firstNode = bookmark.getDomNode();
                    Node nextNode = firstNode.getNextSibling();
                    while(nextNode != null){
                        // 循环查找结束符
                        String nodeName = nextNode.getNodeName();
                        if(nodeName.equals(BOOKMARK_END_TAG)){
                            break;
                        }

                        // 删除中间的非结束节点,即删除原书签内容
                        Node delNode = nextNode;
                        nextNode = nextNode.getNextSibling();

                        ctp.getDomNode().removeChild(delNode);
                    }

                    if(nextNode == null){
                        // 始终找不到结束标识的,就在书签前面添加
                        ctp.getDomNode().insertBefore(run.getCTR().getDomNode(),firstNode);
                    }else{
                        // 找到结束符,将新内容添加到结束符之前,即内容写入bookmark中间
                        ctp.getDomNode().insertBefore(run.getCTR().getDomNode(),nextNode);
                    }
                }
            }
        }

        document.write(outputStream);
        document.close();
    }

pom需要引入的maven包:

<dependency>
			<groupId>org.apache.poi</groupId>
			<artifactId>poi</artifactId>
			<version>3.13</version>
		</dependency>
		<dependency>
			<groupId>org.apache.poi</groupId>
			<artifactId>poi-scratchpad</artifactId>
			<version>3.13</version>
		</dependency>
		<dependency>
			<groupId>org.apache.poi</groupId>
			<artifactId>poi-ooxml</artifactId>
			<version>3.13</version>
		</dependency>

 

 

按照这个方法,普通的文本替换没有问题,但是图片和table等内容无法替换,poi对doc的操作据了解是没有table相关的,docx的table等操作需要自行找到拷贝、替换方案。

 

  • 6
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要用POI替换Word文档中的图片,可以使用如下的代码: ```java import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFPicture; import org.apache.poi.xwpf.usermodel.XWPFRun; import org.apache.poi.xwpf.usermodel.XWPFParagraph; import org.apache.poi.util.IOUtils; public class ReplaceImageInWord { public static void main(String[] args) throws Exception { // 读入原始 Word 文档 FileInputStream fis = new FileInputStream(new File("original.docx")); XWPFDocument document = new XWPFDocument(fis); fis.close(); // 获取所有段落 for (XWPFParagraph paragraph : document.getParagraphs()) { // 获取段落中所有的图片 for (XWPFPicture picture : paragraph.getCTP().getRArray(0).getDrawingArray(0).getInlineArray()) { // 获取图片二进制数据 byte[] data = picture.getCTPicture().getBlipFill().getBlip().getEmbeddedDocument().getByteArray(); // 替换图片 FileInputStream fis2 = new FileInputStream(new File("new-image.png")); byte[] newData = IOUtils.toByteArray(fis2); fis2.close(); picture.getCTPicture().getBlipFill().getBlip().setEmbeddedDocument(newData); } } // 保存 Word 文档 FileOutputStream fos = new FileOutputStream(new File("new.docx")); document.write(fos); fos.close(); document.close(); } } ``` 这段代码中,我们读入原始 Word 文档,然后遍历文档中的所有段落,再遍历每个段落中的所有图片。我们可以使用 `getCTP().getRArray(0).getDrawingArray(0).getInlineArray()` 获取每个段落中的图片。然后,我们可以使用 `getCTPicture().getBlipFill().getBlip().getEmbeddedDocument().getByteArray()` 获取图片的二进制数据,使用 `setEmbeddedDocument()` 方法替换图片。最后,我们保存修改后的 Word 文档。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值