从两个word中提取表格然后合并到一个excel中-- POI使用

1,需求

两个文档,A文档中有一个表格,有多个物品,其中含有行数比较多,但表中无”数量“一列。
B文档表格中行数较少,且比A文档的表格中多包含了”数量“一列。
需要将AB中数据输出到excel中,且包含”数量“这列。

2,想法

步骤:

  1. 寻找从文档中提取表格的工具或者方法。
  2. 寻找将数据写到excel中的工具或方法。
  3. 判断A文档中表格中的物品名称和B文档表格中的物品名称相同时,输出物品和他的数量值。

执行

1,寻找从文档中提取表格的工具或者方法。

经过多方查找,搜得 Apache POI 提供对office的读写操作。注意 4.0.1及以上版本只支持Java 8及以上版本。
在这里插入图片描述
对于从word中提取表格的方法,寻得 https://www.cnblogs.com/fanwenhao/p/11096596.html 此文章,自己运行试验后发现,会报 The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data在这里插入图片描述
因为 HWPFDocument 适用于office 2003版,后缀为.doc的文档(后缀为.doc 但实际还是docx文档的也不行),office 2007及以上版本 使用 XWPFDocument 。

对于XWPFDocument ,下面这篇文章介绍的很详细:https://www.cnblogs.com/unruly/p/7479518.html
于是按照文中的介绍我的提取word中的表格代码如下:

 			FileInputStream in = new FileInputStream(filePath); // 载入文档
            XWPFDocument xwpf = new XWPFDocument(in);
            //获取所有表格
            List<XWPFTable> tables = xwpf.getTables();
            System.out.println(tables);
            List<XWPFTableRow> rows;
            List<XWPFTableCell> cells;

            for (XWPFTable table : tables) {
                //表格属性
                CTTblPr pr = table.getCTTbl().getTblPr();
                //获取表格对应的行
                rows = table.getRows();
                for (XWPFTableRow row : rows) {
                    //获取行对应的单元格
                    cells = row.getTableCells();
                    for (XWPFTableCell cell : cells) {
                        System.out.println(cell.getText());
                    }
                }
            }

但是实验中,报了 Found interface org.apache.poi.util.POILogger, but class was expected错误,查找是因为依赖的版本不一致问题导致的。
在这里插入图片描述

2,寻找将数据写到excel中的工具或方法。

同样是使用POI中的类,可参考 https://www.cnblogs.com/warrior4236/p/5263951.html 。我将其中的HSSFWorkbook 类换成XSSFWorkbook ,更好的适应现在比较常用的office的版本。与上述提取word中的表格进行结合,于是从word中提取表格,写到excel中的程序如下:


        StringBuilder sb = new StringBuilder();
        FileOutputStream fos = null;
        try {
            FileInputStream in = new FileInputStream(filePath); // 载入文档
            XWPFDocument xwpf = new XWPFDocument(in);
            List<XWPFTable> tables = xwpf.getTables();
            System.out.println(tables);
            List<XWPFTableRow> rows;
            List<XWPFTableCell> cells;
            
            XSSFWorkbook workbook = new XSSFWorkbook();
            //sheet工作表的名称
            XSSFSheet sheet = workbook.createSheet("学生信息");

            for (XWPFTable table : tables) {
                //表格属性
                CTTblPr pr = table.getCTTbl().getTblPr();
                //获取表格对应的行
                rows = table.getRows();
                for (XWPFTableRow row : rows) {
                    //获取行对应的单元格
                    cells = row.getTableCells();
                    XSSFRow excelRow = sheet.createRow(rows.indexOf(row));
                    for (XWPFTableCell cell : cells) {
                        XSSFCell excelCell = excelRow.createCell(cells.indexOf(cell));
                        // 6:向单元格内写入内容
                        excelCell.setCellValue(cell.getText());
                    }
                }
            }
            //输出流,输出函数
            fos = new FileOutputStream("E:\\WordAndExcel\\test.xls");//输出位置
            workbook.write(fos);
            fos.flush();

        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (null != fos) {
                try {
                    fos.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }

3,判断A文档中表格中的物品名称和B文档表格中的物品名称相同时,输出物品和他的数量值。

思路:

  1. 创建一个类C,类的属性是A,B表的列的全部。
  2. 然后读取B表中数据全部存入到一个map中,<物品名称,C>。
  3. 读取A表中数据,如果名称相同时,将A表中的数量存入map对应key的value中。
  4. 遍历map,将数据存入新的excel中输出。

4,存在问题。

当文档中的表格存在合并单元格时,输出的对应行的数据就会有问题,暂未找到解决办法。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值