poi获取段落位置_Apache POI:从java中的word文档(docx)中提取段落和后续表格

POI中的Word API仍然处于不稳定状态,但是您应该能够通过以下两种方式之一迭代这些段落:

XWPFDocument doc = new XWPFDocument(fis);

List paragraphs = doc.getParagraphs();

for (XWPFParagraph p : paragraphs) {

... do something here

}

要么

XWPFDocument doc = new XWPFDocument(fis);

Iterator iter = doc.getParagraphsIterator();

while (iter.hasNext()) {

XWPFParagraph p = iter.next();

... do something here

}

Javadocs说XWPFDocument.getParagraphs()检索在页眉或页脚中保存文本的段落,但我必须相信这是一个剪切和粘贴错误,因为XWPFHeaderFooter.getParagraphs()说同样的事情.查看源代码,XWPFDocument.getParagraphs()返回一个不可修改的列表,同时使用迭代器使段落可修改.这可能会在未来发生变化,但这是它现在的工作方式.

要检索所有正文元素,段落和表的列表,您需要使用:

XWPFDocument doc = new XWPFDocument(fis);

Iterator iter = doc.getBodyElementsIterator();

while (iter.hasNext()) {

IBodyElement elem = iter.next();

if (elem instanceof XWPFParagraph) {

... do something here

} else if (elem instanceof XWPFTable) {

... do something here

}

}

这应该允许您按顺序遍历所有body元素.

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值