PDF电子发票解析免费版

1 篇文章 0 订阅

 

package cn.test;

import com.alibaba.fastjson.JSONObject;

import pdf.cn.pdf.parse.PDFReaderUtil;

/**
 * @author 吴顺杰
 * 2019年7月30日
 */
public class TestA {

    public static void main(String[] args) {
        try {
            //识别远程文件
            JSONObject json = PDFReaderUtil.readReceiptPdfURL("http://60.168.130.76:9090/A/xxxxx/20190729/PjPOkdAt.pdf");
            //识别本地文件
            JSONObject json2 = PDFReaderUtil.readReceiptPdfFile("G:/PDF电子发票/淘宝/tb3.pdf");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

 

效果:{"fh":"***","fpdm":"037xxx211","hjse":"***","fplx":10,"spfsbh":"51100xxxx0021430P","spfyhzh":"","kpfsbh":"9137xxxxMPHCM1Y","hwmxs":[{"hh":1,"ggxh":"","se":"***","dw":"","hwmc":"*印刷品*面xxxxxx制度与政策:计合","dj":"36.63333333","sl":"3","je":"109.90","slv":"免税"}],"xsf":"(章)","kpr":"xxx","hjje":"109.90","kpfmc":"枣xxxx口有限公司","kpfyhzh":"中国xxxxxx支行16050xxxx9100xxx027","kpje":"109.90","hwmc":"*印刷品*面向未来的创新型人才发展制度与政策合计","kprq":"2019-07-09","spfmc":"创新xxxx会","spfdzdh":"","skr":"xxxx","slv":"免税","jqbh":"661834363519","kpfdzdh":"xxxxx江,D2座1808室184xxxxx688","fphm":"0xxxx26","jym":"55xxx87109xxxx3"}

链接:https://pan.baidu.com/s/19YyT1Oqq9KMtQm8FmUGYhA 
提取码:1234 
复制这段内容后打开百度网盘手机App,操作更方便哦

ps:原jar出自https://download.csdn.net/download/m0_38035006/10391640,我是在他的基础上面修改了,他的这个jar只能识别本地PDF有税的发票格式文件,我的能识别本地的和远程文件,有税的无税的都可以识别,站在巨人的肩膀上就是轻松......

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 30
    评论
### 回答1: PDF(Portable Document Format,便携式文档格式)和OFD(Open Financial Document,开放金融文件格式)都是电子发票的常用格式之一。电子发票作为一种重要的财务凭证,具有便捷性和环保性等优点。因此,对于电子发票格式的解析是非常重要的。 PDF格式的电子发票可以通过Adobe Acrobat等软件进行打开和编辑,它有良好的兼容性和可靠性。同时,PDF格式还可以通过数字签名等方式进行安全加密和验证。 OFD格式的电子发票是一种由中国金融信息标准化技术委员会制定的标准格式,它具有大容量、高效率、安全可靠的优点。与PDF相比,OFD可以实现更多的业务流程和管理需求,得到了越来越广泛的应用。 在解析电子发票的过程中,需要注意格式的兼容性和安全性。同时,需要对发票的内容进行验证和解析,以确保其真实性和合法性。随着电子商务和数字化技术的不断发展,电子发票的标准化和规范化将成为未来的趋势,电子发票解析和管理也将变得更加智能和高效。 ### 回答2: PDF电子发票和OFD电子发票均属于电子发票的一种格式,它们都具有可存储、可传递等特点,已经得到广泛应用。因其具有数字化、自动化、便捷性及环保节能等优势,已成为现代电子商务的重要组成部分。 在解析PDF和OFD电子发票时,首先需要理解其文档结构和数据格式。PDF在文件头部和尾部均应当有%%EOF标识,以此表示其为PDF文件,其结构包括文档信息、对象结构、交叉引用表、加密和压缩信息等。OFD则采用XML文档格式,由多个层级的节点组成。OFD采用标准的XML语法,其中包含了发票的开具机构、收款方、明细、税费等信息,信息结构清晰且易于解析解析PDF和OFD电子发票时需要使用相应的解析工具,常见的有PDFBox、iText、OFD Reader等工具。这些工具可以帮助我们解析电子发票中的文本、图片、表格等元素,从而将其转化为可读性强、易于处理的数据格式。 综上所述,PDF和OFD电子发票解析是一项重要的技术,对于电子商务及电子发票的推广普及有着至关重要的作用。随着技术的进步和应用的推广,我们相信PDF和OFD电子发票解析也会得到更好的发展和应用。
评论 30
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值