解析PDF发票,并以发票号码为名称上传

//国产PDF解析包,免费的
<!--引入PDF解析包 开始-->
<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.com/nexus/content/groups/public/</url>
    </repository>
</repositories>

<dependency>
    <groupId>e-iceblue</groupId>
    <artifactId>spire.pdf.free</artifactId>
    <version>3.9.0</version>
</dependency>
<!--引入PDF解析包 结束--> 

 @RequestMapping("/invoiceUpload")
    public void invoiceUpload2(HttpServletRequest request){
        JSONObject jsonObj = new JSONObject();
        try {
            MultipartHttpServletRequest multipartRequest = (MultipartHttpServletRequest) request;
            multipartRequest.setCharacterEncoding("utf-8");
            List<MultipartFile> mfs = multipartRequest.getFiles("invoiceUpload");
            String filePath = env.getProperty("file.url");        //从yml文件获取上传路径
            if (mfs.size() > 0) {
                for (MultipartFile btnFile : mfs) {
                    String baseName = FilenameUtils.getBaseName(btnFile.getOriginalFilename());
                    byte[] baseBytes = ArrayUtils.addAll(btnFile.getBytes(), baseName.getBytes());
                    String md5Hex = DigestUtils.md5Hex(baseBytes);
                    // 获取上传文件的路径
                    String uploadFilePath = btnFile.getOriginalFilename();
                    System.out.println("uploadFlePath:" + uploadFilePath);
                    // 截取上传文件的文件名
                    String uploadFileName = uploadFilePath.substring(uploadFilePath.lastIndexOf('\\') + 1,
                            uploadFilePath.lastIndexOf('.'));
                    System.out.println("multiReq.getFile()" + uploadFileName);
                    // 截取上传文件的后缀
                    String uploadFileSuffix = uploadFilePath.substring(uploadFilePath.lastIndexOf('.') + 1,
                            uploadFilePath.length());
                    System.out.println("uploadFileSuffix:" + uploadFileSuffix);

                    File fileTemp=null;
                    File file = new File(filePath + File.separator + md5Hex);   //判断是否存在这一个文件夹
                    if (!file.isDirectory()){   //不存在  则没有这个文件
                        fileTemp = new File(filePath + File.separator + md5Hex + File.separator + uploadFileName + "." + uploadFileSuffix);
                        FileUtils.copyInputStreamToFile(btnFile.getInputStream(), fileTemp);
                        //解析pdf,获取发票号码
                        String filePa = filePath + File.separator + md5Hex + File.separator + uploadFileName + "." + uploadFileSuffix;
                        String invoiceNum = getName(filePa);
                        List<InvoiceFile> invoiceFiles = invoiceFileService.findAll();
                        if (invoiceFiles.size()>0 && invoiceFiles!=null){
                            for (InvoiceFile invoiceFile:invoiceFiles){
                                if (invoiceFile.getFileId().equals(md5Hex) && invoiceFile.getFileNum().equals(invoiceNum)){
                                    throw new RuntimeException("上传失败,数据库中已存在相同发票!!!请重新选择");
                                }
                            }
                        }

                        File fileUrl = new File(filePath + File.separator + md5Hex + File.separator  + invoiceNum + "." + uploadFileSuffix);
                        //if (!fileTemp.exists()){
                        FileUtils.copyInputStreamToFile(btnFile.getInputStream(), fileUrl);   //存储以发票号码为名称的PDF版
                        //}
                        fileTemp.delete();
//                        FileUtils.forceDelete(fileTemp);   //删除最开始存储的
                        System.out.println("发票名称==================="+filePath + File.separator + md5Hex + File.separator  + invoiceNum + "." + uploadFileSuffix);
                        InvoiceFile invoiceFile = new InvoiceFile();
                        invoiceFile.setFileId(md5Hex);
                        invoiceFile.setFileName(uploadFileName);
                        invoiceFile.setFileNum(invoiceNum);
                        invoiceFile.setFileSize(fileUrl.length());
                        invoiceFile.setFileType(uploadFileSuffix);
                        invoiceFile.setFileUrl(filePath + File.separator + md5Hex + File.separator);
                        invoiceFile.setCreateTime(DateUtil.getDateTime());
                        invoiceFileService.saveOrUpdate(invoiceFile);
                        jsonObj.put("code", "success");
                        jsonObj.put("msg", "获取成功");
                    }else {
                        throw new RuntimeException("上传失败,数据库中已存在相同发票!!!请重新选择");
                    }
                }
            }
        }catch (Exception e){
            e.printStackTrace();
            jsonObj.put("code", "fail");
            jsonObj.put("msg", "获取失败");
            if (e instanceof RuntimeException) {
                jsonObj.put("msg", e.getMessage());
            }
        }
        Response.json(jsonObj);
    }
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
读取PDF文件中的信息 package com.zht; import java.io.File; import java.io.UnsupportedEncodingException; import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.SQLException; import java.util.ArrayList; import java.util.List; import com.spire.pdf.PdfDocument; import com.spire.pdf.PdfPageBase; public class ReadPDF { public static void main(String[] args) { //需要复制的目标文件或目标文件夹 String pathname = "F:\\读取PDF中的信息"; // File file = new File(pathname); List list = new ArrayList(); readFile(pathname,list); for(int j=0;j<list.size();j++) { // System.out.println("当前第"+(j+1)+"个----"+list.get(j)); //创建PdfDocument实例 PdfDocument doc = new PdfDocument(); //加载PDF文件 doc.loadFromFile(list.get(j)); StringBuilder sb = new StringBuilder(); PdfPageBase page; //遍历PDF页面,获取文本 for (int i = 0; i < doc.getPages().getCount(); i++) { page = doc.getPages().get(i); sb.append(page.extractText(true)); } // System.out.println(sb.toString()); String str = getStr(sb.toString()); System.out.println(str); String[] arr = str.split(";"); String gh = ""; String gw = ""; for(int i=0;i<arr.length;i++) { arr[i] = arr[i].trim(); if(i==0) { gh = arr[i]; }else if(i==1) { gw = arr[i]; }else { arr[i] = arr[i].replace(gh, "").replace(gw, ""); } } // System.out.println(); insertSQL(arr); // FileWriter writer; // try { ////将文本写入文本文件 // writer = new FileWriter("f://ExtractText.txt"); // writer.write(sb.toString()); // writer.flush(); // } catch (IOException e) { // e.printStackTrace(); // } doc.close(); } } public static String getStr2(String str) { try { byte[] bs = str.getBytes("utf-8"); for(int i=0;i<bs.length;i++) { byte b = bs[i]; if(b==0) { bs[i]=9; } } str =

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

my_name_is_sky

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值