java解析pdf获取pdf中内容信息


import com.itextpdf.text.Rectangle;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.parser.*;
import org.apache.commons.lang.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.core.env.Environment;
import org.springframework.security.core.annotation.AuthenticationPrincipal;
import org.springframework.stereotype.Service;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.multipart.MultipartFile;

import javax.annotation.Resource;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.*;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.List;
import java.util.Map;
    /**
     * @Auther: dingqiming
     * @Date: 2022/12/05 11:14
     * @Description:返回pdf中论文题目的内容
     * @param saveName
     * @return
     * @throws IOException
     */
    public String readLwtm(String saveName) throws IOException {
        String lwtm = "";
        StringBuffer pageContent = new StringBuffer();
        String begStr = "题       目";
        String endStr = "姓       名";
//        File file = new File("G:\\答辩.pdf");
//        InputStream inputStream = new FileInputStream(file);
        InputStream inputStream = ftpOperation.downloadFile(saveName);
        PdfReader reader = new PdfReader(inputStream);
        int pageNum = reader.getNumberOfPages();
        for(int i=1;i<=pageNum;i++){
            //读取第i页的文档内容S
            pageContent.append(PdfTextExtractor.getTextFromPage(reader, i));
        }
        String nr = pageContent.toString();
        int beingIndex = (nr.indexOf(begStr));
        int endIndex = nr.indexOf(endStr);
        if (beingIndex >= 0 && endIndex >= 0){
            lwtm = nr.substring((beingIndex+begStr.length()),endIndex);
            lwtm = lwtm.replaceAll(" ","").replaceAll("\n","");
        }
        return lwtm;
    }
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

D哈迪斯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值