java读取pdf多表格_怎么用java读取pdf中的表格

本文介绍了如何使用Java的ITEXT和PDFBOX库来读取PDF文件中的表格。ITEXT通过RegionTextRenderFilter实现,PDFBOX则利用PDFTextStripperByArea进行区域文本提取。
摘要由CSDN通过智能技术生成

怎么用java读取pdf中的表格

关注:168  答案:2  mip版

解决时间 2021-01-31 03:38

e6cb1a03ad541b3098697807b7bf1798.png

提问者情婲、毒

2021-01-30 10:33

怎么用java读取pdf中的表格

最佳答案

e6cb1a03ad541b3098697807b7bf1798.png

二级知识专家噯倁酒濃

2021-01-30 11:19

ITEXT插件方法

public void parsePdf(String pdf, String txt) throws IOException {

PdfReader reader = new PdfReader(pdf);

PrintWriter out = new PrintWriter(new FileOutputStream(txt));

Rectangle rect = new Rectangle(70, 80, 490, 580);

RenderFilter filter = new RegionTextRenderFilter(rect);

TextExtractionStrategy strategy;

for (int i = 1; i <=

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值