pdf2htmlEX可以将PDF转换成HTML,不同于传统类似软件,它可以:
- 在HTML文件中精确显示原生文本
- 保持PDF中的字体,颜色,位置
- 可以选择,复制,搜索
- 生成的文件大小与解压缩后的PDF文件相当,如果放到支持HTTP压缩的服务器上,网络消耗和PDF相当
- [可选]单HTML文件输出
转换效果实例:
pdf2htmlEX安装
下载、安装:
win: https://github.com/coolwanglu/pdf2htmlEX/wiki/Download的相应版本
linux 下:sudo add-apt-repository ppa:coolwanglu/pdf2htmlex
sudo apt-get update
sudo apt-get install pdf2htmlEX