批量处理PDF文件，获取某些特定信息，生成新的Excel表单

最新推荐文章于 2025-02-12 22:11:10 发布

还能在学一小时

最新推荐文章于 2025-02-12 22:11:10 发布

阅读量1.2k

点赞数 26

分类专栏：日积月累文章标签： pdf

本文链接：https://blog.csdn.net/weixin_43310500/article/details/135410366

版权

文章介绍了如何使用Java编程语言，通过PDDocument和PDFTextStripper库来读取PDF文件的封面信息，然后将数据整理成Map存储，最后生成包含封面数据的Excel表格。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

案例：有个小需求，批量处理大量PDF文件，处理封面信息，生成一个新的Excel用来统计，PDF文件封面如下图图1，生成Excel如下图图2。

解决：

1、获取本地路径下的所有待处理的pdf文件

private static LinkedList<File> getPDFList(String pathName) {
    File file = new File(pathName);
    LinkedList<File> list = new LinkedList<>();
    LinkedList<File> pdfList = new LinkedList<File>();
    if (file.exists()) {
        if (null == file.listFiles()) {
            if (file.getAbsolutePath().endsWith(".pdf")) pdfList.add(file);
        } else {
            list.addAll(Arrays.asList(file.listFiles()));
            while (!list.isEmpty()) {

最低0.47元/天解锁文章