word换pdf并且自动生成目录

目录

利用aspose-word for java和aspose-pdf for java完成word转pdf并且生成目录

1. jacob

2. aspose

2.1 利用aspose-word for java将word转为pdf

2.2 利用aspose-word for java提取word中的标题

2.3 利用aspose-pdf for java插入pdf书签


利用aspose-word for java和aspose-pdf for java完成word转pdf并且生成目录

最近开发的项目涉及到word转pdf,在做了调研之后,发现了几款比较不错的工具:

1. jacob

这个解决方案太依赖于windows的office了,所以自己也只是写了个demo,没有深入研究。

2. aspose

aspose比传统的poi操作word简单了不少,更重要的是支持了doc和docx两种格式

2.1 利用aspose-word for java将word转为pdf

以下代码轻轻松松就可以实现:

// wordPath为word的绝对路径
com.aspose.words.Document doc = new com.aspose.words.Document(wordPath);
// word转pdf,pdfPath为pdf要保存的绝对路径
doc.save(pdfPath, SaveFormat.PDF);

本来以为做完这个功能已经可以摸鱼了,结果下一个功能又来了。(产品问:为什么转换的pdf没有目录呢?)

在苦苦研究了差不多一个多月的时间,终于在公司大神的帮助下,今天彻底完成了这个功能。

2.2 利用aspose-word for java提取word中的标题

com.aspose.words.Document originDoc = new com.aspose.words.Document("D:\\test\\1.doc");
// 后面需要用这个对象去获取当前段落所在的页码
LayoutCollector layoutCollector = new LayoutCollector(originDoc);
// 需要获取所有的section,要不然部分word提取目录不完整
Section[] sections = originDoc.getSections().toArray();
// 获取所有的段落
List<Paragraph> paragraphs = new ArrayList<>();
for (Section s:
    sections) {
    paragraphs.addAll(Arrays.asList(s.getBody().getParagraphs().toArray()));
 }
// 获取标题的关键代码。标题对应的值为0-8,提取自己所需标题即可
p.getParagraphFormat().getOutlineLevel();
// 获取页码
layoutCollector.getEndPageIndex(p);
// 获取标题名称
p.getListLabel().getLabelString() + " " + p.getText();

以上只是部分代码,需要源码的可以私信我。

2.3 利用aspose-pdf for java插入pdf书签

Document pdfDoc = new Document(filePath);
OutlineCollection outlineCollection = pdfDoc.getOutlines();
for (HeadingNode node :
                list) {
    OutlineItemCollection outLineItem = new                 
    OutlineItemCollection(outlineCollection);
    outLineItem.setTitle(node.getHeaderName());
    outLineItem.setAction(new GoToAction(node.getHeaderPage()));
    addPdfBKRecursive(node, outlineCollection, outLineItem);
    outlineCollection.add(outLineItem);
}
pdfDoc.save();

所以,整个功能的实现逻辑应该是:word转为pdf,获取原word的目录大纲,根据word获取的目录大纲添加pdf书签。在获取word目录和添加pdf书签都用到了递归。

最后附一张自己完成功能的战果图:

原word的目录

转换为pdf书签之后的效果

每一个功能在没有实现出来之前是那样不切实际,实现出来之后自身又成长不少,所以,不用急于去下结论。

  • 9
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 15
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值