pdf、ofd等格式发票自动处理、识别、分类程序pyhton实现
财务发票处理难点及处理方案
先看看效果:
发票信息获取程序,极速获取,加线程可以更快
这是很快的,加了线程的话更快。
目前很多发票识别程序都是收费厉害的,不收费的话,手动调用一张张发票进行处理既没有效率也让人难以招架。所以开发了这一程序,处理范围涵盖了财务的发票范围。只需把发票的文件、文件夹、压缩包放在指定文件夹,一键就可以完成发票的检测、识别、统计,进而得出excel报告。
发票解析
ofd发票是目前越来越多被用起的发票格式,这里很好的完成了该格式的发票的识别。
项目描述
- 处理文件、压缩包等不同格式的发票;
- 分类,踢出非可解析的文件;
- 两步解析,查漏补缺,确保所需数据的完整识别;
- 处理提取数据,生成报表。
另外可以按照实际的业务流程改进项目,使得项目更好地满足和支持业务。
[处理结果文件夹](https://img-blog.csdnimg.cn/7504d28e3a7c41cab77af3f78b83b58e.png单线程运行下,二十条发票可以在3秒内完成。200条发票可以在10s内完成识别生成报告。多线程下速度会更快。
实现了
![开票日期 货物 服务类别 发票号码 发票代码 合计金额 合计税额 金额 购买方名称 销售方名称 销售方纳税人识别号 校验码 来源 来源人
]
等内容的识别。