先获取poppler库,编译出lib与dll,配置好依赖环境,获取某页所有文本:
输出到txt文本:
测试效果是可以将pdf文本全部读出来,并且成功的输出到文本文件,但是有点瑕疵是,pdf读出来的一行数据内容可能会分成2行或者多行,但是文本获取没有问题
先获取poppler库,编译出lib与dll,配置好依赖环境,获取某页所有文本:
输出到txt文本:
测试效果是可以将pdf文本全部读出来,并且成功的输出到文本文件,但是有点瑕疵是,pdf读出来的一行数据内容可能会分成2行或者多行,但是文本获取没有问题