文字识别软件测试简历,OCR技术简介

原标题:OCR技术简介

随着人工智能的发展,生活中也逐渐出现了很多便捷高效的应用,人脸识别、证件识别认证、名片识别、车牌识别等,都在方便着我们的日常生活。同样,这些技术也可以为我们的日常业务处理流程提供智能高效的解决方案。

日常交易、清算业务往来存在各种电子邮件、传真等单据,主要有确认成交单据、定存协议、对敲指令、银行间费用、网下中签公告、境外券商确认单等。这些单据需要人工识别提取要素录入系统,通过使用OCR技术,对单据图像内容进行识别、矫正,提取关键字段元素,与相关系统连接,能够减少人工手动录入,提高工作效率,降低人工录入失误。

30a1ce9b6a550c910179a3a52ce66114.png

光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。通常,图像信息通过扫描仪、照相机、电子传真软件等设备获取并存储在图像文件中,然后OCR软件读取、分析图像文件并通过字符识别提取出其中的字符串。

2faab865649de3b6d526de181cfc00ff.png

144b7edc44aa3380b203979fd4070638.png

典型的OCR的技术路线如下图所示:

046a5fa02144d17735f4fda219261a73.png

在OCR技术中,图像预处理通常是针对图像的成像问题进行修正。输入文本经过扫描仪进入计算机后,由于纸张的厚薄、光洁度和印刷质量都会造成文字畸变,产生断笔、粘连和污点等干扰,所以在进行文字识别之前,要对带有噪声的文字图像进行处理。由于这种处理工作是在文字识别之前,所以被称为预处理。预处理一般包括灰度化、二值化,几何变换(透视、扭曲、旋转等),畸变校正,去除模糊、图像增强和光线校正,行、字切分,平滑,规范化等等。

4c8d1fe4d876c4080a902f040699c07a.png

其中最重要的环节,也是影响识别准确率的环节是文字检测和文本识别。文字检测是检测文本的所在位置和范围及其布局,包括版面分析和文字行检测等。文字检测主要解决的问题是哪里有文字,文字的范围有多大。

文本识别是在文本检测的基础上,对文本内容进行识别,主要识别每个文字是什么。对一个文字图像,提取出特征,丢给分类器,分类器就对其进行分类,告诉你这个特征该识别成哪个文字。分类器的设计方法一般有:模板匹配法、判别函数法、神经网络分类法、基于规则推理法等。在进行实际识别前,往往还要对分类器进行训练,这是一个监督学习的过程。成熟的分类器也有很多,有SVM,CNN等。将图像中的文本信息转化为文本信息。

识别出的文本可以通过匹配词库中的词典加以矫正,比如形近字的处理:“分”和“兮”形近,但是如果遇到“分数”这个词语,就不应该识别为“兮数”,因为“分数”才是一个正常词语。这就需要通过语言模型来进行纠正,通常需要再次核对以保证其正确性。

THE END

OCR技术的步骤繁多,涉及的算法复杂。但随着识别算法的不断改进和成熟,文字编码库更加精准,OCR识别的准确率大幅提升,目前OCR文字特征的主流算法,文字识别率几乎能达到95%以上,同时,也有比较成熟的OCR引擎,能够帮助开发人员提高开发效率。

前期,我们已经对部分业务近千份文档单据进行了测试,整体成功率达97%以上。通过引入OCR技术,也将会优化业务处理流程,减少人工提取操作,提高清算、估值业务的自动化水平,让业务流程更加简单高效。返回搜狐,查看更多

责任编辑:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值