对公转账上传凭证OCR测试

一、什么是OCR

OCR(Optical Character Recognition光学字符识别)是指通过对图像的分析处理将图像中的文字信息识别、提取并转化为计算机文字,简单来说是识别图片中的字符转化为可编辑文档。例如识别书籍扫描照片中的文字、识别身份证照片中的关键信息、识别银行卡照片中的银行卡号等。

  • OCR的一般过程为图像预处理特征提取文字区域检测文本识别与输出

  • OCR技术从文字类型的角度可分为印刷文字识别手写文字识别,从识别目的的角度可分为通用OCR专用OCR

  • 通用OCR是指对图片中所有文字和字符进行识别,并可返回文字对应位置信息。

  • 专用OCR是指对图片中的特定位置、特定信息进行识别提取,通常是针对票据、证件、牌照等制式票证图片。

二、什么是OCR测试

OCR模型是OCR功能的核心,经过大量图片及标注数据学习训练而成,在此基础上封装为OCR服务对外提供服务,通常以联机接口形式实现供其他系统调用。

OCR测试可分为两部分,一是对OCR模型识别的效果进行测试,判断其是否满足业务应用场景的要求,二是对OCR服务进行测试,包括功能测试性能测试以及安全测试等。

三、OCR测试案例分享

做B2B电商项目时涉及到对公转账,买家需上传支付凭证(银行转账电子回单)。未实现OCR功能前,买家不仅需要手动填写转账的相关信息还需上传凭证,操作起来容易出错且效率低,为了提质增效客户提出了增加OCR识别票据的需求,基于此测试人员需要测试该功能。

3.1 OCR测试步骤

  1. 收集大量支付凭证的样本。可以从现有的数据集中获取,也可以自己制作。要尽可能涵盖不同类型和格式的支付凭证,以提高OCR的鲁棒性。

  1. 选择OCR技术和工具。OCR技术包括传统的基于规则和模板的方法,以及基于深度学习的方法。你可以根据需求选择适合的技术和工具。常用的OCR工具包括Tesseract、OCRopus、Adobe Acrobat、ABBYY FineReader等。

  1. 对样本进行预处理。由于支付凭证的图片质量可能不一,需要进行预处理,例如去除噪声、调整亮度和对比度、裁剪、旋转等。

  1. 进行OCR测试。将样本图片输入到OCR工具中,让工具自动识别文本信息。可以通过手动校对OCR结果的方式来评估OCR的准确率。

  1. 优化OCR结果。根据测试结果,分析OCR错误的原因,进一步优化OCR模型和参数,以提高准确率。

需要注意的是,OCR技术虽然可以提高处理效率,但并不是100%准确,可能会出现识别错误的情况。因此,在使用OCR技术处理重要数据时,一定要进行人工审核和确认,确保数据的准确性。

3.2 OCR测试方案

支付凭证OCR功能测试的目标是确保OCR系统可以准确地识别支付凭证中的信息,包括付款人、收款人、付款金额等,并将识别结果转换为可编辑的文本格式。以下是一些可以考虑的测试方案:

  1. OCR准确性测试:收集包含不同类型和格式的支付凭证图片样本,例如PDF、JPG、PNG等,分别进行OCR测试,并将OCR结果与手动输入的正确数据进行比较,验证OCR识别准确率是否达到预期要求。

  1. 数据格式测试:测试系统是否能够正确地将识别结果转换为可编辑的文本格式,例如txt、doc等。

  1. 图像质量测试:测试系统是否能够正确地处理各种图像质量的支付凭证图片,包括模糊、倾斜、噪声等。

  1. 多语言支持测试:测试系统是否能够正确地识别不同语言的支付凭证信息,例如中文、英文、日文等。

  1. 性能测试:测试系统处理多个支付凭证的性能,包括处理时间、系统稳定性等。

  1. 异常处理测试:测试系统是否能够正确地处理各种异常情况,例如无法识别的字符、缺失信息、重复信息等。

测试完成后,需要对测试结果进行分析,确定系统的准确性、稳定性和性能是否符合预期要求,并及时修复和优化系统中存在的问题。同时,还需要对测试过程中发现的问题进行记录和归档,以便后续追溯和改进。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值