文字识别助力智能运营，加速金融业务流转效率

飞桨PaddlePaddle

于 2022-09-14 19:57:50 发布

阅读量218

点赞数

文章标签：算法大数据人工智能机器学习 java

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2OTEzODA5MA==&mid=2247592115&idx=2&sn=b1604269b96631f50d4d843010fed3b1&chksm=cea28376f9d50a60096295108482cd8ee7ef6ccf531e283cff2e093dd660ba7cb4d480a380ce&scene=126&&sessionid=0

版权

智慧金融在金融服务的业务流程中不断深入，金融行业数字化建设的过程除了面向外部客户的服务与销售外，行业内部的支持性系统也在随之升级。智能合规、智能运营广泛应用于企业内部财务管理系统、报销系统、核算系统以及审核系统等平台中，促使数据沉淀，加速流程效率，实现数字化建设闭环。

在智能运营覆盖的各个场景中，计算机视觉、自然语言处理、传统机器学习算法等人工智能技术充分应用。其中文字识别技术（OCR）作为计算机视觉的主要方向之一，其识别对象包括扫描合同、印章、卡证、表格与票据信息结构化，在业务办理、风险控制、内部数据库建设与信息支撑等场景中都扮演着重要角色。

图1 智能运营中的OCR应用

场景问题

在这些场景中，图片数据一方面通过对纸质文档和票据的扫描来获取，另一方面包含对证件拍照的方式获取。面临的场景难点和技术难点同时存在：

难点一：印章识别场景中的文字遮挡、模糊、弯曲程度高，印章类型多；
难点二：扫描文档文字密集，检测漏检与识别精度对后续关键信息提取系统影响大；
难点三：拍摄卡证图片时的透视变换、过曝过暗、有色阴影等问题；
难点四：表格种类繁多，差异性大，缺乏开源数据，无标注工具；
难点五：基于图像处理和规则的表格识别难度大，通用性差；
难点六：弯曲文本的端到端算法的精度问题与两阶段算法的速度问题需要权衡。

图2 表格识别中数据种类的多样性

解决方法

良好的算法模型是解决上述问题的首要因素，这不仅要求算法模型对于某个类型的对象的识别精度能够满足业务需求，还要其拥有良好的泛化能力。飞桨文字识别开发套件PaddleOCR针对自然场景下的OCR任务提供面向产业级的超轻量通用OCR系统PP-OCRv3，经过海量数据训练，达到产业级SOTA，在工业制造、交通等行业中得到广泛验证。针对文档场景提供智能文档分析系统PP-Structurev2，实现表格识别、关键信息提取、版面分析与恢复任务。

图3 PP-OCRv3应用效果

图4 PP-Structurev2文档分析流程图

场景应用

场景1

印章弯曲文本检测与识别

印章检测识别是定位合同文件和常用票据中印章位置，提取识别印章内容的任务。可以用于检测合同文件和票据中是否有印章，对比印章内容，验证是否有业务风险。实际业务中通过人工审核对比的方式成本高，效率低。为了降本增效，提高生产效率，基于PaddleDetection和PaddleOCR开发套件，实现印章检测以及印章文字识别任务，代替人工识别，降低成本，辅助印章比对验证业务，提高验证效率，降低财税及商务合同签订过程的业务风险。

图5 印章文本检测与识别

场景2

扫描版合同关键信息抽取

合同审核广泛应用于大中型企业、上市公司、证券、基金公司中，是规避风险的重要任务。实际业务中人工进行纸质版合同审核成本高，工作量大。针对以上场景PaddleOCR+PaddleNLP可以快速提取文本内容，经过少量数据微调即可准确抽取关键信息，高效完成合同内容对比、合规性检查、风险点识别等任务，提高效率，降低风险。

图6 扫描版合同关键信息抽取

场景3

通用卡证结构化信息提取

卡证识别的应用遍布于银行、保险、证券、信托等各种金融机构，在业务办理和信息核验场景中需要识别身份证、银行卡、驾驶证、营业执照等。由于数据的采集来源多样，存在各种噪声，如图片方向混乱、反光、模糊、倾斜问题的干扰，且一般需要对卡证信息进行结构化输出。针对上述问题，基于PaddleClas与PaddleOCR完成卡证方向与类型分类，多方案卡证检测对比与识别，最终H-Means达到93%以上。

图7 通用卡证结构化信息提取

（个人信息为虚构，仅用于展示说明使用）

场景4

中文表格识别与属性分析

中文表格识别在保险理赔、财报分析和信息录入等场景应用颇多，实际业务中人工进行录入成本高，同时，开源中文表格数据集少也限制了中文表格识别模型的发展。针对以上情况，通过采用数据标注、数据合成和微调等场景适配方法，同时结合表格属性识别，快速完成中文表格识别任务。

图8 中文表格识别与属性分析

关于

PaddleOCR

PaddleOCR除了提供产业级特色模型PP-OCR与PP-Structure以外，打通从数据合成标注、模型训练到推理部署的应用全流程。提供22种训练部署方式，半自动标注工具PPOCRLabel，《动手学OCR》电子书以及丰富的场景应用和前沿算法，通过全流程的开发体验助力产业界快速落地OCR应用。

图9 PaddleOCR全景图

注：上述图片均来源于网络

课程预告

9月15日（周四）和9月20日（下周二）将由百度研发工程师联合外部合作伙伴带来金融行业智能运营主题课程分享，名额有限，感兴趣的朋友可扫码预约课程：

相关地址

飞桨官网

https://www.paddlepaddle.org.cn

PaddleOCR项目地址

https://github.com/PaddlePaddle/PaddleOCR

https://gitee.com/PaddlePaddle/PaddleOCR

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

飞桨PaddlePaddle

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文字识别助力智能运营，加速金融业务流转效率

智慧金融在金融服务的业务流程中不断深入，金融行业数字化建设的过程除了面向外部客户的服务与销售外，行业内部的支持性系统也在随之升级。智能合规、智能运营广泛应用于企业内部财务管理系统、报销系统、核算系统以及审核系统等平台中，促使数据沉淀，加速流程效率，实现数字化建设闭环。在智能运营覆盖的各个场景中，计算机视觉、自然语言处理、传统机器学习算法等人工智能技术充分应用。其中文字识别技术（OCR）作为计算机视...
复制链接

扫一扫