Java-POI读取word(docx)书签

<w:bookmarkStart> <!--书签开始-->
<w:bookmarkEnd> <!--书签结束-->

/**
     * word书签开始部分
     */
    public static final String BOOKMARK_START_TAG = "w:bookmarkStart";
    /**
     * word书签结束部分
     */
    public static final String BOOKMARK_END_TAG = "w:bookmarkEnd";


/**
     * 获取书签内容并返回
     * 
     * @param wordPath
     * @param fileName
     * @return
     */
    public String getBookMarkContent(String wordPath,String fileName){
        isFileExit(wordPath,fileName);
        List<String> resBookMarkContent = new ArrayList<>();
        String resStr = "";
        try {
            FileInputStream inputStream = new FileInputStream(wordPath);
            // HWPF提供读写Microsoft Word DOC格式档案的功能。
            XWPFDocument docx = new XWPFDocument(inputStream);
            // 获取body部分的dom对象
            Node bodyNode = docx.getDocument().getBody().getDomNode();
            List<Node> bookmarkNodeList = new ArrayList<>();
            // 获取书签
            getBookmarksFromNode(bodyNode, bookmarkNodeList);
            // 对结果进行遍历 并获取具体名称
            for (Node node : bookmarkNodeList) {
                String nodeValue = node.getAttributes().getNamedItem("w:name").getNodeValue();
                resBookMarkContent.add(nodeValue);
            }
            resStr = String.join(" ", resBookMarkContent);
        }catch (Exception e){
            throw new CheckRuntimeException(LaboratoryStatusEnum.LABORATORY_DOMAIN_52079);
        }
        return resStr;
    }

    /**
     * 递归解析所有Node节点,将bookmark记录到集合中
     *
     * @param node
     * @param bookmarkNodeList
     */
    public void getBookmarksFromNode(Node node, List<Node> bookmarkNodeList) {
        // 如果nod的名称是书签开始<w:bookmarkStart> <!--书签开始-->
        if (node.getNodeName().equals(BOOKMARK_START_TAG)) {
            bookmarkNodeList.add(node);
        }else if(node.getNodeName().equals(BOOKMARK_END_TAG)){
            // 如果书签结束 直接退出
            return ;
        }else {
            // 递归获取子节点书签
            NodeList childNodes = node.getChildNodes();
            for (int i = 0, j = childNodes.getLength(); i < j; i++) {
                Node childNode = childNodes.item(i);
                getBookmarksFromNode(childNode, bookmarkNodeList);
            }
        }
    }

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值