Java使用pdfbox将pdf转图片

前言

目前比较主流的两种转pdf的方式,就是pdfbox和icepdf,两种我都尝试了下,icepdf解析出来有时候会出现中文显示不出来,网上的解决方式又特别麻烦,不是安装字体,就是重写底层类,所以我选择了pdfbox

添加依赖

<dependency>
	<groupId>org.apache.pdfbox</groupId>
	<artifactId>pdfbox</artifactId>
	<version>3.0.0</version>
</dependency>

代码

import org.apache.pdfbox.Loader;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.nio.file.Files;
import java.nio.file.Paths;

public class Main {
	public static void main(String[] args) throws Exception {
		// 加载pdf文件
		PDDocument doc = Loader.loadPDF(new File("data.pdf"));
		// 2.x版本的pdfbox写法
		// PDDocument doc = PDDocument.load(new File("data.pdf"));
		PDFRenderer renderer = new PDFRenderer(doc);
		// 遍历每页pdf
		for (int i = 0; i < doc.getNumberOfPages(); i++) {
			// dpi调到300左右即可,太小会模糊,太大会使图片变得很大
			BufferedImage image = renderer.renderImageWithDPI(i, 300);
			ImageIO.write(image, "jpg", Files.newOutputStream(Paths.get("data_" + i + ".jpg")));
		}
	}
}

在arm架构的linux上转换可能会出现模糊情况

在windows上好好的,x86_64的linux上也好好的,就是arm架构的linux上会出现

网上的博客基本上不是安装字体,就是重写底层类,但你永远不会想到是jdk的问题,这个一般是低版本的jdk8导致的

解决办法:将jdk8升级到8u311或以上,或者使用高版本的jdk即可

转换效果如下:

 附上高版本的jdk8下载地址:https://www.oracle.com/java/technologies/downloads/#java8 

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Apache PDFBox是一个用于处理PDF文件的Java库,它不支持直接将epub换为图片。但是,可以使用其他库或工具将epub换为PDF文件,然后使用PDFBoxPDF文件换为图片。 以下是将epub换为PDF文件的步骤: 1. 使用Java ePub Reader库读取epub文件并提取内容。 2. 使用iText库将提取的内容写入PDF文件。 以下是将PDF文件换为图片的步骤: 1. 使用PDFBox库打开PDF文件。 2. 使用PDFRenderer类将每一页渲染为BufferedImage对象。 3. 将BufferedImage对象保存为图片文件。 下面是一个示例代码,它将epub文件换为PNG图片: ```java import java.awt.image.BufferedImage; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.util.List; import javax.imageio.ImageIO; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.rendering.PDFRenderer; import nl.siegmann.epublib.domain.Book; import nl.siegmann.epublib.domain.Resource; import nl.siegmann.epublib.epub.EpubReader; public class EpubToImageConverter { public static void main(String[] args) throws Exception { File epubFile = new File("sample.epub"); File pdfFile = new File("sample.pdf"); File outputDir = new File("output"); // Convert epub to PDF Book book = new EpubReader().readEpub(epubFile); PDDocument pdfDoc = new PDDocument(); for (Resource resource : book.getContents()) { pdfDoc.addPage(resourceToPdfPage(resource)); } pdfDoc.save(pdfFile); pdfDoc.close(); // Convert PDF to images PDDocument doc = PDDocument.load(pdfFile); PDFRenderer renderer = new PDFRenderer(doc); for (int i = 0; i < doc.getNumberOfPages(); i++) { BufferedImage image = renderer.renderImage(i); File outputFile = new File(outputDir, String.format("page-%03d.png", i + 1)); ImageIO.write(image, "png", outputFile); } doc.close(); } private static PDDocument resourceToPdfPage(Resource resource) throws IOException { BufferedImage image = ImageIO.read(resource.getInputStream()); PDDocument doc = new PDDocument(); doc.addPage(new org.apache.pdfbox.pdmodel.PDPage()); org.apache.pdfbox.pdmodel.PDImageXObject ximage = org.apache.pdfbox.pdmodel.graphics.image.LosslessFactory.createFromImage(doc, image); org.apache.pdfbox.pdmodel.PDPageContentStream contentStream = new org.apache.pdfbox.pdmodel.PDPageContentStream(doc, doc.getPage(0)); contentStream.drawImage(ximage, 0, 0); contentStream.close(); return doc; } } ``` 此代码将epub文件换为PDF文件,然后将PDF文件的每一页换为PNG图片,并将它们保存在指定的输出目录中。请注意,此代码仅为示例,可能需要进行修改以适合您的特定需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值