PDF转HTML的方法。

    上个项目客户提出了一个需求,要求把PDF格式的文件转化为HTML格式。

 上网查了一下,要么使用软件处理,要么是HTML格式转化为PDF。因为涉及到图文识别问题,所以说仅仅依靠前端不能实现。在网上查了几种方法,最后拍板使用pdf2htmlEX.

 pdf2htmlEX是一款开源的软件,所以说可以镶嵌到自己的项目之中,不用再手动使用软件去转化格式。

 资源在网上可以搜索的到。

 使用方法:

      1:下载资源,解压之后在本页面打开命令窗口。

      

      2:直接在命令窗口输入命令

        

        pdf2htmlEX后面为PDF文件地址,--dest-dir后,后面为输出地址。网上有具体的命令参数就不一一列举了。

        转化生成的文件:

        

  因为是要求点击列表切换网页,最后我是把转化后的HTML网页使用iframe标签引入到一个现实网页之中,最后通过点击事件动态改变iframe的href属性值来实现网页跳转问题。

 

  当然,如果是自己需要PDF转化HTML还是推荐使用软件,操作起来比较快捷方便。但是如果是项目中需要转化HTML还是推荐使用pdf2htmlEX,首先要自己使用命令窗口调试出合适的参数,然后通过后端技术转换。这样遇到大批量处理PDF转化HTML的话不用手动一一去转化。

 

转载于:https://www.cnblogs.com/LittleT/p/9259171.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值