宜信OCR技术探索与实践|直播速记

宜信技术学院

于 2020-07-28 15:13:22 发布

阅读量433

点赞数 2

分类专栏：宜信研发实践文章标签：算法机器学习人工智能深度学习 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gao2175/article/details/107636592

版权

宜信OCR技术探索与实践|宜信技术沙龙第12期

导读：随着人工智能的热度上升，图像识别这一分领域也渐渐被人们所关注。在公司的业务中，有很多扫描、拍照单据、凭证等进行识别的需求。为了帮助业务实现这些图片文档的识别和结构化，我们进行了一系列的实践和探索，最终确定了深度学习的文字检测和识别模型，作为主要的实现手段，从而满足了业务上的需求。实践过程中，我们遇到过一系列的问题和难点，最终都一一解决，本次分享我们将结合目前的业务需求，说说我们在探索中遇到的痛点和难点，和识别技术中的一些技术细节。

分享大纲：

1、业务上的诉求和痛点；

2、OCR技术的应用场景，以及对业务的重要性；

3、宜信OCR技术解决方案：

 	——产品能力

	——未来规划

4、OCR技术的的发展和演进；

5、主流算法科普：CTPN、EAST、PSENet；CRNN、Attention OCR；

6、OCR技术实践:样本生成、算法改造、论文的实现等。

PPT下载链接: https://pan.baidu.com/s/1XD0hVF_-VGMVbnlStTR2aw 密码: lnf8

分享实录

一、OCR概述

1.1 OCR技术演进

传统图像，冈萨雷斯的图像处理。
信号处理、频域分析以及各类算法：SIFT、HOG、HOUGH、Harris、Canny…都很赞。
从2016年以后业界基本上都已经转向深度了，因为效果真的特别好。

1.2 OCR技术商业服务

身份证卡证类相对容易些，但是要做到复杂场景的，也不是那么容易。
发票、业务单据相对复杂，除了识别，更重要的是版面分析。
最近表格识别比较火，各家都在努力实现，微软的开放tablebank数据集
移动端backboneMobileNet，或者是tesseract+opencv

二、我们的业务场景

2.1 业务需求

满足业务是第一需要，不同于大厂，对外服务API࿰

最低0.47元/天解锁文章

宜信技术学院

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
宜信OCR技术探索与实践|直播速记

宜信OCR技术探索与实践|宜信技术沙龙第12期导读：随着人工智能的热度上升，图像识别这一分领域也渐渐被人们所关注。在公司的业务中，有很多扫描、拍照单据、凭证等进行识别的需求。为了帮助业务实现这些图片文档的识别和结构化，我们进行了一系列的实践和探索，最终确定了深度学习的文字检测和识别模型，作为主要的实现手段，从而满足了业务上的需求。实践过程中，我们遇到过一系列的问题和难点，最终都一一解...
复制链接

扫一扫

专栏目录

宜信技术学院

博客等级

码龄6年

企业官方账号

203
原创

76
点赞

460
收藏

197
粉丝

关注

私信

热门文章

分类专栏

最新评论

宜信OCR技术探索之版面分析业务实践|技术沙龙直播速记
半岛铁盒.: 太秀了
Spring事务的传播行为案例分析
真正的飞鱼: 您好，我想问下，传播行为及对应含义的那个图片，出处是哪里，我没有找到
Q-learning算法实践
代码抄袭专业户: 说得很清楚非常有用比我研究生的老师说得清楚多了
宜信开源|Davinci：可视应用平台介绍与展望
黄发垂髫: 为什么注册新账户一直出错:Authentication failed; nested exception is javax.mail.AuthenticationFailedException: 502 Invalid input from 100.107.4.130 to newxmesmtplogicsvrsza8.qq.com 没有发现原因,邮箱的OP3/SMTP服务也开启了
FIX协议介绍
U97F3: FIX、Binary消息解析工具：https://gitee.com/CriticalHit/Trading-Message-Manager

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。