MATLAB发票识别系统

MATLAB发票识别系统


摘要

本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对发票图片信息数据进行识别读取以获得OCR图像识别结果,发票信息验证处理单元对OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,发票信息分类展示单元对发票信息数据进行分类展示处理,综合地实现发票信息数据的采集、识别、查验、处理与存储的全过程.


1dd63dc1612644b91bfd1108105cdff6.png








1 .一种基于OCR图像识别技术的发票采集管理系统,其特征在于,包括依次连接的发票信息采集单元、OCR图像识别单元、发票信息验证处理单元、发票信息存储管理单元和发票信息分类展示单元,所述发票信息采集单元采集发票图片信息数据,所述OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对所述发票图片信息数据进行识别读取以获得OCR图像识别结果,所述发票信息验证处理单元对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,所述发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,所述发票信息分类展示单元对所述发票信息存储管理单元存储的发票信息数据进行分类展示处理。

  1. .根据权利要求1所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所

述发票信息验证处理单元包括互相连接的发票类型鉴定模块和发票信息查验模块,所述发票类型鉴定模块连接在所述OCR图像识别单元和所述发票信息存储管理单元之间,所述发票信息查验模块一端远程连接至税务局增值税发票真伪查验平台同时另一端与所述发票信息存储管理单元相连,所述发票类型鉴定模块对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为非增值税发票时发送至发票信息存储管理单元存储,在鉴别为增值税发票时发送至发票信息查验模块,所述发票信息查验模块在所述发票类型鉴定模块的鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验并在查验为真时发送至发票信息存储管理单元进行重复归集核查和相应存储。

  1. .根据权利要求2所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息存储管理单元包括相互连接的发票信息重复归集核查模块和发票信息数据库, 所述发票信息重复归集核查模块与发票信息查验模块相连,所述发票信息数据库连接于所述发票类型鉴定模块和所述发票信息分类展示单元之间,发票信息重复归集核查模块接收查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查,所述发票信息数据库接收鉴别结果为非增值税发票的OCR图像识别结果直接进行存储同时接收重复归集核查结果为未重复的增值税发票的OCR图像识别结果进行存储。

4 .根据权利要求1-3之一所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述OCR图像识别单元结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。

  1. .根据权利要求4所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述OCR图像识别结果为json格式的结构化信息数据。
  2. .根据权利要求5所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述发票类型鉴定模块基于发票代码和/或发票号码并结合税务局官方的发票类型判断规则对所述OCR图像识别结果的发票类型进行鉴别。

7 .根据权利要求6所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息采集单元包括但不限于基于移动端和/或PC端通过拍照上传、相册上传以及图库上传的方式进行发票信息采集。

  1. .一种基于OCR图像识别技术的发票采集管理方法,其特征在于,所述方法在采集发票图片信息数据后利用OCR图像识别技术结合人工智能深度学习算法对所述发票图片信息数


据进行识别读取以获得OCR图像识别结果,再对所述OCR图像识别结果的发票类型进行鉴别,在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验, 当查验结果为真时再对相应的增值税发票的OCR图像识别结果进行重复归集核查,并在核查结果为未重复时将OCR图像识别结果进行相应存储;或,在鉴别结果为非增值税发票时, 对非增值税发票的OCR图像识别结果直接进行存储;然后对发票信息数据进行分类展示处理。

  1. .根据权利要求8所述的基于OCR图像识别技术的发票采集管理方法,其特征在于, 所述方法在采集发票图片信息数据后利用OCR图像识别技术结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。
  2. .根据权利要求8或9所述的基于OCR图像识别技术的发票采集管理方法,其特征在于,对所述OCR图像识别结果的发票类型进行鉴别具体为:基于发票代码和/或发票号码并结合税务局官方的发票类型判断规则对所述OCR图像识别结果的发票类型进行鉴别;

和/或,所述采集发票图片信息数据包括但不限于基于移动端和/或PC端通过拍照上传、相册上传以及图库上传的方式。

  • 0
    点赞
  • 0
    收藏
  • 打赏
    打赏
  • 0
    评论
智能发票识别系统 Requirements tomcat服务器 eclipse mysql数据库 redis数据库 Function 自动归类识别机打发票中的发票信息 用户手动绘制用于识别的发票模板和识别区域 查看等待识别发票的任务缓冲队列 可视化发票识别算法的过程,动态展示当前识别的区域和结果 管理员可对系统平台内的用户、用户组进行权限编辑管理 单位负责人可修改使用系统平台的单位信息 个人设置可查看个人信息和权限 Details 前端 Jquery + bootstrap搭建前端框架,处理前端逻辑和展示,负责MVC架构中的View视图层 前后端通过websocket和ajax通信,ajax主要用于按钮等控件的事件处理函数中的请求,websocket用于后端主动向前端推送消息 JSP控制cookies和session,在页面跳转时记录会话用户态,并可通过前端可视化界面对用户权限(用户权限分为继承的用户组权限和个人权限)进行编辑 识别算法的可视化通过websocket实现,算法端将每个区域的识别结果通过后台服务器逐次转送给前端,前端在onmessage回调函数中处理信息并在可视化窗口的canvas画布中显示出来 通过画布的getImageData和putImageData获取图片的像素点,并制造模糊效果,对比突出当前的识别区域 Js + canvas实现用户动态画图的效果,可以在canvas画布中框出自定义的识别区域和填写区域信息 后端 Spring MVC + Spring + JDBC搭建后端框架,Controller负责接收请求,Service负责主要业务逻辑,Dao负责数据库访问 算法端用C++编写,java后端通过多线程+socket+TCP与算法端通讯,利用对象锁完成线程调度 利用redis实现缓冲队列以及模板操作调度队列 利用spring-websocket与前端进行全双工通信 使用shiro作为安全管理框架,通过其内置session实现安全登录,使用shiro注解完成权限管理。 算法端 使用Bag of Words + CNN完成票据分类,根据分类结果查询并获取相应的发票模板。 使用SIFT特征匹配和配准思路完成票据对齐 根据模板中信息区域坐标截取ROI,因为票据可能存在套打情况,故还使用了约束式ROI搜索算法对信息区域进行重定位。 对每个ROI进行去噪、去印章、去直线等预处理操作,并使用形态学处理得到目标文本信息的连通体的最小外接矩形,并将此区域送入OCR模块。 使用搭建好的基于深度学习的卷积神经网络进行文字识别,识别结果组装成协议格式,返回给后台。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

话外仙子

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值