java解析pdf,文字、表格、图片

添加spire.pdf依赖,依赖需要下载到本地仓库

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>http://repo.e-iceblue.com/nexus/content/groups/public/</url>
    </repository>
</repositories>

<dependency>
    <groupId>e-iceblue</groupId>
    <artifactId>spire.pdf</artifactId>
    <version>2.2.0</version>
</dependency>
public static void main(String[] args) {
    try {
        PdfDocument doc = new PdfDocument();
        doc.loadFromFile("C:\\TTT\\test\\day01.pdf");
        StringBuilder sb = new StringBuilder();
        PdfPageBase page;
        for (int i = 0; i < doc.getPages().getCount(); i++) {
            //获取每一行的page对象
            page = doc.getPages().get(i);
            sb.append(page.extractText(true));
            // 这个if中是图片的解析输出
            if (page.extractImages() != null) {
                for (BufferedImage image : page.extractImages()) {
                    if (image != null) {
                        //指定输出图片名,指定图片格式,后缀自己换
                        File output = new File("C:\\TTT\\test\\copy\\a.png");
                        ImageIO.write(image, "PNG", output);
                    }
                }
            }
        }
        System.out.println(sb);
        doc.close();
    } catch (Exception e) {
        e.printStackTrace();
    }

}
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值