见标题
以下是使用pdfbox提取pdf的文字,现在想提取pdf里面的印章,有朋友在线帮忙么
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDDocumentCatalog;
import org.apache.pdfbox.text.PDFTextStripper;
import java.io.File;
import java.io.IOException;
public class Test {
public static void main(String[] args) {
File pdfFile = new File("D:\\test.pdf");
PDDocument document = null;
try {
document = PDDocument.load(pdfFile);
// 获取页码
int pages = document.getNumberOfPages();
// 读文本内容
PDFTextStripper stripper = new PDFTextStripper();
// 设置按顺序输出
stripper.setSortByPosition(true);
stripper.setStartPage(1);
stripper.setEndPage(pages);
PDDocumentCatalog cata = document.getDocumentCatalog();
String content =