PDF转图片乱码问题解决

问题描述

1、PDF转图片使用技术:pdfbox(具体代码百度随处可见)

2、问题概述:控制台报错,找不到字体,C:\Windows\FONTS\mstmc.ttf

10:52:06.162 [main] ERROR org.apache.pdfbox.pdmodel.font.FileSystemFontProvider - Could not load font file: C:\Windows\FONTS\mstmc.ttf

问题分析

由于找不到字体

问题解决

网上的各种方法都试了,比如:安装字体,代码解析的时候只用自定义字体,但是都不好使

最终通过查看源码,修改源码解决问题,重写org.apache.pdfbox.pdmodel.font.FontMapperImpl,增加本地存在字体,问题解决:

substitutes.put("STSong-Light", Arrays.asList("STFangsong"));

提示:该方法暂时只在本地开发测试通过,如果正式上生产环境,还需确认生产环境是否有STFangsong字体

 

代码(2020-05-25更新)

    好多人说用了这种方式还是没办法生成,补充一下用到的jar包和对应的代码,后续多多关照

pom依赖

        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>fontbox</artifactId>
            <version>2.0.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox-tools</artifactId>
            <version>2.0.17</version>
        </dependency>

代码实现

    /**
     * 转换全部的pdf
     * @param fileAddress 文件地址
     * @param filename PDF文件名
     * @param type 图片类型
     */
    public static void pdf2png(String fileAddress,String filename,String type) {
        // 将pdf装图片 并且自定义图片得格式大小
        File file = new File(fileAddress+"\\"+filename+".pdf");
        try {
            PDDocument doc = PDDocument.load(file);
            PDFRenderer renderer = new PDFRenderer(doc);
            int pageCount = doc.getNumberOfPages();
            for (int i = 0; i < pageCount; i++) {
                BufferedImage image = renderer.renderImageWithDPI(i, 144); // Windows native DPI
                // BufferedImage srcImage = resize(image, 240, 240);//产生缩略图
                ImageIO.write(image, type, new File(fileAddress+"\\"+filename+"_"+(i+1)+"."+type));
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    public static void main(String[] args) throws InterruptedException, IOException {
        PdfUtils.pdf2png("F:/", "hetong", "jpg");
//        PdfUtils.pdf2Image("F:/haha.pdf");

    }

 

  • 6
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 23
    评论
你可以尝试使用第三方库来解决Java中PDF图片乱码问题。一个常用的库是Apache PDFBox,它提供了强大的PDF处理功能。你可以通过以下步骤来进行换: 1. 首先,确保你已经添加了Apache PDFBox库到你的项目中。你可以从官方网站上下载最新版本的jar文件,并将其添加到你的项目的依赖中。 2. 使用PDFBox库加载PDF文件,并将其换为图片。你可以使用以下代码示例: ```java import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.rendering.PDFRenderer; import javax.imageio.ImageIO; import java.awt.image.BufferedImage; import java.io.File; public class PdfToImageConverter { public static void main(String[] args) { try { PDDocument document = PDDocument.load(new File("input.pdf")); PDFRenderer pdfRenderer = new PDFRenderer(document); for (int page = 0; page < document.getNumberOfPages(); ++page) { BufferedImage bim = pdfRenderer.renderImageWithDPI(page, 300); ImageIO.write(bim, "PNG", new File("output" + page + ".png")); } document.close(); } catch (Exception e) { e.printStackTrace(); } } } ``` 在上面的代码中,我们使用PDFRenderer类将PDF文件的每一页换为BufferedImage对象,并将其保存为PNG格式的图片。 3. 运行代码后,你将得到多个以数字命名的图片文件,表示PDF文件中的每一页。你可以根据需要对这些图片进行进一步处理或展示。 请注意,如果PDF文件中包含中文或其他非ASCII字符,你可能会遇到乱码问题。为了解决这个问题,你可以尝试使用其他的PDF处理库,比如iText或PDFBox的子项目PDFBox-Layout,它们提供了更好地支持中文字符的功能。 希望以上信息对你有帮助!如有任何疑问,请随时提问。
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值