spire.pdf 读取pdf中的表格数据

1、下载jar包

spire.pdf-4.10.2.jar

2、读取数据
public class PdfTest {
    public static void main(String []args) throws Exception {
        String path = "/Users/macbook/Downloads/894.pdf";
        //传入pdf文件
        PdfDocument pdf = new PdfDocument(path);
        //创建PdfTableExtractor
        PdfTableExtractor extractor = new PdfTableExtractor(pdf);
        //循环PDF页面
        for (int pageIndex = 0; pageIndex < pdf.getPages().getCount(); pageIndex++) {
            //将数据表从当前页提取到PdfTable数组中
            PdfTable[] tableLists = extractor.extractTable(pageIndex);
            if (tableLists != null && tableLists.length > 0) {
                for (PdfTable table : tableLists) {
                    //循环数据表的行
                    for (int i = 0; i < table.getRowCount(); i++) {
                        //列
                        List<String> list = new ArrayList<String>();
                        for (int j = 0; j < table.getColumnCount(); j++) {
                            //提取到数据
                            String text = table.getText(i, j);
                            System.out.println(text+"-----行坐标:"+i+"------列坐标:"+j);
                            //---------------------业务处理(根据自己的需求而定)-------------
                            if (i>=2){
                                if(j == 0 ){
                                    text = replaceBlank(text);
                                    System.out.println("这是处理后的字符串"+text);
                                }
                                list.add(text);
                            }
                        }
                        //循环list集合,可存入数据库
                        list.forEach(data ->{
                            System.out.println("数据内容:"+data);
                        });
                    }
                }
            }
        }
    }

    /**
     *规整数据
     * @param str
     * @return
     */
    public static String replaceBlank(String str) {
        String dest = "";
        if (str!=null) {
            Pattern p = Pattern.compile("\\s*|\t|\r|\n");
            Matcher m = p.matcher(str);
            dest = m.replaceAll("");
        }
        return dest;
    }
}
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: Java Spire.PDF 是一款功能强大的 Java PDF 操作工具包,它可以帮助开发者对 PDF 文档进行读取、创建、编辑、转换等操作。与其他一些 PDF 库不同的是,Java Spire.PDF 没有任何使用限制,无论是开发者个人使用还是商业使用都是完全免费的。 Java Spire.PDF 支持 PDF 文档的各种操作,包括添加文本、插入图片、合并拆分 PDF 文档等等。同时,它还可以进行 PDF 的安全设置,包括密码保护、数字签名等功能。此外,Java Spire.PDF 还支持多种输出格式的转换,如将 PDF 转换为 Word、Excel、HTML 等格式。 值得一提的是,Java Spire.PDF 还提供了非常详尽的文档和示例,这些资源可以帮助开发者更加深入地理解和使用 Java Spire.PDF。同时,Java Spire.PDF 的官方支持也非常及时有效,开发者在使用过程遇到问题可以及时得到帮助和解决。 总之,Java Spire.PDF 是一款非常实用和优秀的 Java PDF 操作工具包,它的无限制使用让开发者可以更加灵活地对 PDF 进行操作,也许它正是你所需要的工具。 ### 回答2: Java Spire.PDF是一种功能强大的Java库,它支持PDF文档的创建、编辑和转换等操作。与其他PDF库相比,Java Spire.PDF不仅具有易用性和性能优势,而且可以免费使用,没有任何限制。 使用Java Spire.PDF,您可以轻松地创建PDF文档并设置各种元素,如文本、图像、表格和图表等。同时,您还可以对PDF文档进行编辑操作,如添加、删除、替换和重排页等。此外,Java Spire.PDF还支持将PDF文档转换为其他格式,如Word文档、图片和HTML等。 与一些商业PDF库相比,Java Spire.PDF的无限制使用使得它成为Java开发者的首选库之一。使用Java Spire.PDF,您可以在项目轻松集成PDF的功能,使得您的应用程序更加完善和实用。无论是开发企业级文档管理系统,还是为客户定制高质量的报告或合同,Java Spire.PDF都可以帮助您轻松实现这些功能。 ### 回答3: Java Spire.PDF是一个强大的Java PDF文档编程库,它可以帮助开发者轻松创建、阅读、修改、转换和打印PDF文档。相比其他PDF工具,Java Spire.PDF无限制地提供了许多功能和特性,使得开发者可以更加自由地使用和操作PDF文件。 Java Spire.PDF无限制是指它不仅支持处理常规的PDF文档,还可以识别和处理更加复杂的PDF文档,例如被密码保护、数字签名或加密的PDF文档。此外,Java Spire.PDF还可以添加和编辑PDF文档的书签、注释和水印等元素,方便用户对PDF文档进行分类和标记。 Java Spire.PDF还支持多种文档转换格式,比如将PDF文档转换为其他格式的文档,如Word、Excel等,以方便用户更好地编辑和使用。此外,Java Spire.PDF还提供了丰富的API文档和示例代码,使得开发者可以快速上手并轻松实现自己的需求。 总之,Java Spire.PDF是一款功能强大的PDF编程库,为开发者无限制地提供了许多功能和特性,使得开发者可以更加便捷地创建、阅读、修改、转换和打印PDF文档。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是福强

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值