最近我们在项目上需要解析Pdf文件中的表格,然后对比两个相似的pdf文件中的表格数据,并返回对比结果。
package Pdf.Pdf;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import org.apache.pdfbox.PDFBox;
import org.apache.pdfbox.pdfparser.PDFParser;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
public class App {
public static void main(String[] args) throws Exception {
ParsePdf("D:\\a.pdf");
ParsePdf("D:\\b.pdf");
String oldData = parseTxt(new File("a.txt"));
String newData = parseTxt(new File("b.txt"));
System.out