java 解析PDF 含表格

最新推荐文章于 2024-08-03 23:19:15 发布

程序员汪

最新推荐文章于 2024-08-03 23:19:15 发布

阅读量1.1w

点赞数

分类专栏：解析文章标签： pdf 数据

本文链接：https://blog.csdn.net/wdw131409/article/details/78889122

版权

项目需求涉及解析PDF文件中的表格数据，并进行对比。主要关注如何从PDF中有效地提取表格内容并进行相同PDF间的数据比对。

摘要由CSDN通过智能技术生成

最近我们在项目上需要解析Pdf文件中的表格，然后对比两个相似的pdf文件中的表格数据，并返回对比结果。

package Pdf.Pdf;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

import org.apache.pdfbox.PDFBox;
import org.apache.pdfbox.pdfparser.PDFParser;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class App {

	public static void main(String[] args) throws Exception {
		ParsePdf("D:\\a.pdf");
		ParsePdf("D:\\b.pdf");
		String oldData = parseTxt(new File("a.txt"));
		String newData = parseTxt(new File("b.txt"));
		System.out

最低0.47元/天解锁文章

程序员汪

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
4
评论
java 解析PDF 含表格

最近我们在项目上需要解析Pdf文件中的表格，然后对比两个相似的pdf文件中的表格数据，并返回对比结果。package Pdf.Pdf;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import
复制链接

扫一扫

专栏目录