Java使用PDFBox API实现对PDF文档进行关键字检索
最近项目上需要获得pdf文档中某一个字/词的坐标,发现网上的普遍都是基于itext实现的,不过实际使用下来发现itext的文字提取比较乱,有的时候提取出一个字,有的时候提取出一段话,不太方便,于是在解决问题的过程中发现了基于PDFBox的文字提取API,稍加整合,实现了关键字检索基本实现0偏移,但是感觉效率上不是很优美,但又说不上哪里可以优化,下面贴代码,希望能得到大家的完善.
...
原创
2018-11-07 15:41:53 ·
7382 阅读 ·
5 评论