boolean sort = false;// 是否排序 |
02 | int startPage = 1;// 开始提取页数 |
03 | int endPage = Integer.MAX_VALUE;// 结束提取页数 |
04 | Writer output = null;// 文件输入流,生成文本文件 |
05 | PDDocument document = null;// 内存中存储的PDF Document |
07 | document = PDDocument.load(file); |
08 | ByteArrayOutputStream baos = new ByteArrayOutputStream(); |
09 | output = new OutputStreamWriter(baos); |
10 | PDFTextStripper stripper = null;// PDFTextStripper来提取文本 |
11 | stripper = new PDFTextStripper(); |
12 | stripper.setSortByPosition(sort);// 设置是否排序 |
13 | stripper.setStartPage(startPage);// 设置起始页 |
14 | stripper.setEndPage(endPage);// 设置结束页 |
15 | // 调用PDFTextStripper的writeText提取并输出文本 |
16 | stripper.writeText(document, output); |
17 | return baos.toString(); |
18 | } catch (MalformedURLException e) { |
21 | if (output != null) {// 关闭输出流 |
24 | if (document != null) {// 关闭PDF Document |
转载于:https://my.oschina.net/staraf/blog/97595