java实现word转pdf(功能转载)(亲测验证)

转载自​​​​​​​java将Word转换成PDF三种方法

作者https://blog.csdn.net/weixin_38409915 

亲测三种方法

第一种方法新版本word会报错,转换不了,询问了下其他网友同出现问题

第三种方法可以转换,但是编码不一样,我们业务上传的百度文库,百度审核人员反馈的是文件不识别

所以尽量使用第二种,亲测有效,编码大部分都识别

jacob.jar包下载地址 https://download.csdn.net/download/qq_37241221/86404350

需要 window 环境

积分设置的0分,如果以后出现需要积分下载联系我重改下,官方会自动变动积分数

贴上代码避免原帖子以后失效跳转不了

import java.io.File;

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

/**
 * 效果最好的一种方法,但是需要 window 环境,而且速度是最慢的需要安装 msofficeWord 以及 SaveAsPDFandXPS.exe (
 * word 的一个插件,用来把 word 转化为 pdf,可以不用安装,本次未安装测试通过 )
 */
public class WordToPdf {

    private static final int wdFormatPDF = 17; // PDF 格式

    public void wordToPDF(String sfileName, String toFileName) {

        System.out.println("启动 Word...");
        long start = System.currentTimeMillis();
        ActiveXComponent app = null;
        Dispatch doc = null;
        try {
            app = new ActiveXComponent("Word.Application");
            app.setProperty("Visible", new Variant(false));
            Dispatch docs = app.getProperty("Documents").toDispatch();
            doc = Dispatch.call(docs, "Open", sfileName).toDispatch();
            System.out.println("打开文档..." + sfileName);
            System.out.println("转换文档到 PDF..." + toFileName);
            File tofile = new File(toFileName);
            if (tofile.exists()) {
                tofile.delete();
            }
            Dispatch.call(doc, "SaveAs", toFileName, // FileName
                    wdFormatPDF);
            long end = System.currentTimeMillis();
            System.out.println("转换完成..用时:" + (end - start) + "ms.");

        } catch (Exception e) {
            System.out.println("========Error:文档转换失败:" + e.getMessage());
        } finally {
            Dispatch.call(doc, "Close", false);
            System.out.println("关闭文档");
            if (app != null)
                app.invoke("Quit", new Variant[]{});
        }
        // 如果没有这句话,winword.exe进程将不会关闭
        ComThread.Release();
    }

    public static void main(String[] args) {
        WordToPdf d = new WordToPdf();
        d.wordToPDF("E:\\JianBao\\downloadPath\\上海骄成机电设备有限公司企业发展分析报告.docx", "E:\\JianBao\\downloadPath\\上海骄成机电设备有限公司企业发展分析报告.pdf");
    }

}

扩充总结:转换后的pdf是文字型pdf,我们业务是上传到百度文库,但是文库有个确定就是百度官方将手机上浏览器浏览方式默认显示为阅读模式,百度模式分两种,一种是原版一种是阅读,原版好理解就是原先啥样式就是啥样式,阅读模式是为了考虑到使用手机流量的用户节省流量,自动解析将pdf里认为不必要的东西给过滤掉,比如背景图这种,这样非常影响手机浏览器显示样式,但是客户还要全显示,最后没辙只能将文字型pdf转换为图片型pdf,就是用文字pdf全分解截图成图片再合并新的pdf,没办法只能这么搞

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
Java PDFBox是一个开源的Java库,可以用来处理PDF文件。它提供了丰富的功能,包括创建、编辑、合并和提取PDF文件的内容。 要将Word文件换为PDF,首先需要使用Java代码将Word文件读取到内存中。可以使用Apache POI库来实现这一功能。然后,可以使用PDFBox库将Word文件的内容和格式换为PDF格式。 首先,需要在你的Java项目中引入Apache POI和PDFBox的依赖库。然后,可以使用POI库的API读取Word文件的内容,并将其存储在内存中。接下来,可以使用PDFBox库的API创建一个空白的PDF文件,并将Word文件的内容和格式写入PDF文件中。 以下是一个简单的示例代码,用于将Word文件换为PDF: ```java import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.PDPageContentStream; import org.apache.pdfbox.text.PDFTextStripper; import org.apache.poi.xwpf.extractor.XWPFParagraphDecorator; import org.apache.poi.xwpf.extractor.XWPFWordExtractorDecorator; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; public class WordToPDFConverter { public static void main(String[] args) { try { // 读取Word文件 File wordFile = new File("path/to/word/file.docx"); FileInputStream fis = new FileInputStream(wordFile); XWPFDocument doc = new XWPFDocument(fis); // 创建PDF文件 PDDocument pdfDoc = new PDDocument(); PDPage page = new PDPage(); pdfDoc.addPage(page); // 写入Word文件内容到PDF文件 PDPageContentStream contentStream = new PDPageContentStream(pdfDoc, page); PDFTextStripper stripper = new PDFTextStripper(); XWPFWordExtractorDecorator extractor = new XWPFWordExtractorDecorator(doc); stripper.writeText(contentStream, extractor.getDocument().getBodyElements()); // 保存PDF文件 pdfDoc.save("path/to/pdf/file.pdf"); pdfDoc.close(); doc.close(); System.out.println("WordPDF成功!"); } catch (IOException e) { e.printStackTrace(); } } } ``` 运行上述代码后,将生成一个PDF文件,其中包含了Word文件的内容和格式。 需要注意的是,由于WordPDF的格式差异较大,换过程中可能会丢失某些复杂的格式或布局。因此,在使用Java PDFBox进行WordPDF时,建议对换结果进行验证和调整,以确保与原始Word文件的一致性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值