(6) POI定位word表格

这里可以读word目录,word表格,word图片。当然不只是读出来,而是将word转成html。(我们的还要将word内容进行分页显示)

我在前两篇里已经写到如何读word的表格,word的图片。

这里边涉及两个定位问题,一是表格位置,另一个是图片位置。

图片位置。我解决图片位置是首先读出word中的图片放到list中去,然后采用文本方式读word,读出来替换(int)1 + ""。插入图片链接。

至于这种方式是否100%奏效,我不清楚。因为我也是读到有图片word后,输出unicode码观察才知道。

ps:昨天翻阅api,读PicturesTable类,那里也是这么说的,应该是没什么问题的。 

表格位置。由于是先解决的图片,而且也可以通过简单的方法拿到所有的表格,所以顺着图片的思路就下来了,但是发现用那种方式无法解决。

呵呵,原本要放弃了,但是我一想既然可以从word里拿出表格,就一定有方式定位到表格的开头。于是断点跟入源码。发现了解决方式。就是paragraph.isInTable() && paragraph.getTableLevel() == 1。

考虑到表格开始的特殊判断方式,最终决定使用看似比较笨的方式来读取纯文本。

 

  1. HWPFDocument hwpfDoc = new HWPFDocument(inputStream);  
  2. Range range= hwpfDoc.getRange();  
  3. int paraNum = range.numParagraphs();  
  4. List tempList = new ArrayList();  
  5. boolean tableBegin = true;  
  6.         String str = null;  
  7.         for (int j = 0; j < paraNum; j++) {     
  8.             Paragraph para = range.getParagraph(j);  
  9.             if(para.isInTable()&& tableBegin) { //在表格里,且是表格开始。  
  10.                 str = "这是一个表格标志";  
  11.                 tableBegin = false;  
  12.             } else if(!para.isInTable()) {//不在表格里  
  13.                 tableBegin = true;  
  14.                 str = para.text();  
  15.             }else {                      //在表格里,但不是表格开始。  
  16.                 continue;  
  17.             }  
  18.             str = doLuanMa(str);  
  19.             //替换图片连接。  
  20.             while (str.indexOf((int)1 + "") != -1) {  
  21.                 str = str.replaceFirst((int)1 + """<a href="\" mce_href="\""WordPicture?pic="  
  22.                         + i + "\">图片</a>");  
  23.                 i++;  
  24.             }  
  25.             tempList.add(str);  

 

表格处理余下的思路就和图片一样了。

最后在唠叨两句,由于处理过程消耗的内存不小,没有修改Jre内存很可能出现内存溢出,这并不是程序有什么死循环。

消耗内存我也愁啊。并发访问岂不是很容易挂掉...~_~


  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: POI是一个用于处理Microsoft Office文件的Java API。在Word文档中,表格是一个常用的元素。要在表格中进行行循环,可以使用Apache POI提供的方法。 首先,需要使用POI来打开Word文档。通过以下代码可以实现: File file = new File("example.docx"); FileInputStream fis = new FileInputStream(file); XWPFDocument document = new XWPFDocument(fis); 接下来,需要定位到要遍历的表格Word文档中的表格通常由一个或多个表格行组成。可以使用以下代码,遍历表格中的每一行: List<XWPFTable> tables = document.getTables(); for (XWPFTable table : tables) { List<XWPFTableRow> rows = table.getRows(); for (XWPFTableRow row : rows) { // 在这里对遍历到的行进行操作 // ... } } 这个代码块首先对整个文档中的所有表格进行遍历,对于每一个表格,再对其包含的行进行遍历。 遍历到每一行后,可以对其包含的单元格进行操作。可以使用以下代码,遍历每一行中的单元格: List<XWPFTableCell> cells = row.getTableCells(); for (XWPFTableCell cell : cells) { // 在这里对遍历到的单元格进行操作 // ... } 这个代码块首先获取当前行中的所有单元格,然后对每一个单元格进行操作。 通过以上的方法,就可以使用POIWord文档中的表格进行行循环,可以方便地进行操作和处理。 ### 回答2: 在 POI 中,我们可以使用循环来遍历表格中的每一行数据。首先,我们需要获取表格对象,然后利用下标来访问每一行。具体步骤如下: 1. 通过 workbook 对象获取 sheet 对象: ``` Sheet sheet = workbook.getSheetAt(0); ``` 2. 获取表格的最后一行的下标: ``` int lastRowNum = sheet.getLastRowNum(); ``` 3. 使用 for 循环遍历每一行: ``` for (int i = 0; i <= lastRowNum; i++) { Row row = sheet.getRow(i); // TODO: 对每一行数据进行处理 } ``` 在循环中,我们使用 `getRow` 方法获取当前循环到的行对象,然后可以对这一行数据进行处理,例如获取单元格的值、修改单元格的样式等。 需要注意的是,POI 中的行下标从 0 开始计数,而且在遍历表格行时要注意判断是否为空行。如果表格中有合并的单元格,可以使用 `CellRangeAddress` 类来获取合并单元格的范围,并在遍历单元格时跳过这些单元格。 总而言之,POI 提供了方便的 API 来遍历和操作 Word 文档中的表格数据,只需要按照以上步骤进行即可实现行循环。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值