java实现从url获取PDF内容

Java直接URL获取PDF内容题外话网上很多Java通过pdf转 HTML,转文本的,可是通过URL直接获取PDF内容,缺没有,浪费时间,本人最近工作中刚好用到,花了时间整理下,分享出来,防止浪费时间,Apache的pdfbox 2013年都有了。import java.io.*;import java.net.MalformedURLException;import java.n...
摘要由CSDN通过智能技术生成

Java直接URL获取PDF内容

题外话

网上很多Java通过pdf转 HTML,转文本的,可是通过URL直接获取PDF内容,缺没有,浪费时间,本人最近工作中刚好用到,花了时间整理下,分享出来,防止浪费时间,Apache的pdfbox 2013年都有了。

import java.io.*;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;



import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;


/**
 * 通过URL获得PDF内容 转存
 * @author sunyang
 * @date 2019/1/24 14:40
 */
public class PdfText2Url {
   

    public static void main(String[] args) {
   
        try {
   
            //需要获取到的PDF地址
    readPdf("https://img1.xxx.org/tech/file/9bd7/733b/7ef54fbf672cfffaf2b1a6c2.pdf"
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要批量合成一个PDF文件,我们可以使用Java中的URL类来实现。 首先,我们需要准备一个URL列表,代表要合成的所有文件的地址。可以从本地文件系统或网络上获取这些URL。 接下来,我们需要使用Java中的PDF库来实现合成功能。有很多PDF库可供选择,如iText,Apache PDFBox等。这些库都提供了用于创建和操作PDF文件的API。 我们可以使用循环遍历URL列表,并依次打开每个URL,并将其内容添加到最终的PDF文件中。具体步骤如下: 1. 导入所选的PDF库的相关类和方法。 2. 创建一个新的PDF文件,并设置一些基本属性,如文件名称、创建者等。 3. 循环遍历URL列表: a. 使用URL类打开当前URL获取文件内容。 b. 使用PDF库提供的方法,将文件内容添加到PDF文件中。可以选择将整个文件作为一个页面添加,或者将文件内容分成多个页面进行添加。 4. 关闭PDF文件。 以下是一个简单例子展示了如何使用URL和iText库来合成PDF文件: ``` import java.net.URL; import com.itextpdf.text.Document; import com.itextpdf.text.DocumentException; import com.itextpdf.text.pdf.PdfCopy; import com.itextpdf.text.pdf.PdfReader; public class PDFComposer { public static void main(String[] args) { try { // 创建新的PDF文件 Document document = new Document(); PdfCopy copy = new PdfCopy(document, new FileOutputStream("output.pdf")); document.open(); // 遍历URL列表 String[] urls = {"http://example.com/file1.pdf", "http://example.com/file2.pdf", "http://example.com/file3.pdf"}; for (String url : urls) { // 打开URL获取文件内容 URL fileUrl = new URL(url); InputStream inputStream = fileUrl.openStream(); // 将文件内容添加到PDF文件中 PdfReader reader = new PdfReader(inputStream); copy.addDocument(reader); copy.freeReader(reader); reader.close(); inputStream.close(); } // 关闭PDF文件 document.close(); } catch (IOException | DocumentException e) { e.printStackTrace(); } } } ``` 通过上述代码,我们可以使用Java中的URL类和iText库来批量合成多个PDF文件为一个单独的PDF文件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值