OCR版面分析痛点
1.基于规则(比较复杂,情况很多)
2.端到端版面分析算法
发票类型:
增值税电子普通发票,增值税普通发票,增值税专用发票
1.增值税电子普票:
2.增值税专用普票:
3.增值税普通普票
发票区别
1.专票和普票的区别:为了满足抵扣认证的需要,增值税专用发票都是有固定样式的。普通发票可以有很多其他样式。并不一定是上图这种。比如你商场购物取得的发票等等。
2.与增值税发票区别:电子发票突破了传统纸质增值税发票的概念;采取电子签章实现发票签名、电子盖章,实现电子发票唯一性、不可抵赖性、防篡改;通过数字媒体形式传送与保存发票内容,可通过网络、移动通信等方式传送给接收方。
发票要素
1.发票代码、发票号码、开票日期、校验码、税后金额等。
2.二维码识别校验。
识别票面左上角的二维码,获取发票代码、号码、金额、开票日期、校验码五个字段信息,与识别到的对应字段信息进行匹配校验,保证更高的识别准确率
大厂的发票识别
-
腾讯云(全字段识别,密码区除外)https://cloud.tencent.com/act/event/ocrdemo
1.增值税电子发票
2.增值税专用发票(无校验码):
-
百度(全字段识别,支持在线识别别)https://ai.baidu.com/tech/ocr_receipts/vat_invoice
1.增值税电子发票
暂缺样例
2.增值税专用发票
3.增值税普通发票
合合:(全字段识别,支持在线)https://ai.ccint.com/api/vision/vat_invoice
1.增值税电子发票
2.增值税专用发票
价格:
百度:480/万次(调用)
8w+/次定制(部署)
腾讯云:560/万次(调用)
参考链接:
https://zhuanlan.zhihu.com/p/145312833
https://blog.csdn.net/weixin_43514766/article/details/114638384
YOLOv3 + CRNN + CTC+基于规则版面分析: