解析pdf文档的字体是否嵌入、索引图、页数、内文尺寸

使用PDFBox 2.0库解析PDF文档,获取页数、字体嵌入情况及索引图信息。通过遍历页面对象,检查图像和字体资源,判断是否有索引图和字体是否嵌入。
摘要由CSDN通过智能技术生成

在网上发现并没有关于pdf文档内索引图等的解析,自己查API发现TM官方也没有关于类似的方法,只能自己迂回前进。每一步都经过debug,才会更清晰的了解对象结构。

废话不多说,直接来干货。菜鸟一枚,大神轻喷。

工具:pdfbox 2.0    eclipse;

主要代码: InputStream file = new FileInputStream(resource + new String(fileName.getBytes("UTF-8"), "UTF-8"));//获取远程pdf文件
PDDocument document = PDDocument.load(file);//获取pdf对象
PDDocumentCatalog catalog = document.getDocumentCatalog();//获取pdf对象目录
COSDictionary cd = catalog.getCOSObject();//获取对象字典(这丫到底怎么叫我也搞不清楚)

map.put("page", document.getNumberOfPages());
map.put("iskey", "false");//是否有索引图,默认false没有

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值