批量处理PDF文件,获取某些特定信息,生成新的Excel表单

文章介绍了如何使用Java编程语言,通过PDDocument和PDFTextStripper库来读取PDF文件的封面信息,然后将数据整理成Map存储,最后生成包含封面数据的Excel表格。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

案例:有个小需求,批量处理大量PDF文件,处理封面信息,生成一个新的Excel用来统计,PDF文件封面如下图图1,生成Excel如下图图2。

解决:

1、获取本地路径下的所有待处理的pdf文件

private static LinkedList<File> getPDFList(String pathName) {
    File file = new File(pathName);
    LinkedList<File> list = new LinkedList<>();
    LinkedList<File> pdfList = new LinkedList<File>();
    if (file.exists()) {
        if (null == file.listFiles()) {
            if (file.getAbsolutePath().endsWith(".pdf")) pdfList.add(file);
        } else {
            list.addAll(Arrays.asList(file.listFiles()));
            while (!list.isEmpty()) {
      
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值