业界领先的识别技术
准确全面的识别结果
基于业务的应用场景
产品介绍
智能图片处理OCR软件是一款基于业界领先的深度学习技术,提供多场景、多类别、多语种、高精度的整体文字检测和识别服务,它综合使用图像处理、计算机视觉、自然语言和深度学习等技术,准确全面的识别扫描件和图片中的文字及手写字体,在识别的同时实现图片的结构化处理。
产品架构
智能OCR软件支持对扫描件、图片、手写体的识别,将非结构化数据转化为结构化数据,囊括了由文件上传、非结构化数据格式转换、OCR识别结果下载等模块的产品体系,融合主流机器学习以及深度学习框架,提高OCR识别准确率和速率。
OCR接口层:提供基础和定制化的API接口,可以根据应用场景定制化开发,此外,还提供HTTP接口。
平台调度层:对能力请求进行调度和负载均衡。
核心能力层:提供文档、图片、手写体、扫描件、表格、合同等OCR识别的核心技术能力。
管理后台:通过web页面,提供服务配置,服务器管理等功能。
基于深度学习的OCR识别流程
识别核心采用卷积神经网络和循环神经网络:
· 卷积神经网络用于提取特征
· 循环神经网络用于联系特征之间的上下文关系
产品功能
01 图片上传
支持上传格式:PNG、JPG、JPEG等格式。
支持种类:通用识别、手写识别。
02 OCR识别
完成上传后,自动启动OCR识别,系统显示当前识别进度;
完成识别后,可对完成的数据,进行识别结果查看、下载、校正等功能。
03 识别比对
可以针对识别结果和原文进行同步的比对,并且支持结果放大模式查看。
04 定位对比
可以将识别结果与实体进行定位对比,让用户查看更方便。
05 表格识别
产品支持表格识别,能够识别各类规则表格、不规则表格。数据上传后,系统会自动进行表格识别,一次抽取为独立的表格,用户可对表格单独下载。
06 结果下载
识别结果支持word、PPT、excel下载。
07 结果校正
通用识别支持图片识别结果校正,单击即可编辑OCR的识别结果,并同步保存在识别结果中;
单击长按即可查看原始文件内容,也可查看历史校正记录。
产品优势
01更全
提供通用场景的文字识别、票据文字识别、卡证文字识别、表格文字识别、印章识别、签字识别等多种识别类型。
02 更准
针对图片模糊、倾斜、翻转等情况进行了优化,识别速度快,总体识别准确率高达95%。文字识别准确率、框线识别准确度均达到行业前列水平。
03 更新
采用业界最新的算法模型和识别方式。
04 更捷
支持java、python等语言的便捷调用;支持梦想云部署;便捷训练和扩展模型;便捷服务安装;便捷权限控制。
05 更快
机器学习版和深度学习版全量功能处理速度达到业界领先水平,单张图的文字识别速度可达到每秒一张。
06 可定制
为客户的特定业务需求提供定制化建模和开发,并深度集成到客户已有的系统中,满足客户的特殊业务需求。
应用场景
适用于各种日常办公场景和油气田专业场景
场景一
信息录入
场景二
资料结构化
场景三
内容审核纠错
关于梦想云
中国石油勘探开发梦想云以“两统一、一通用”为核心,构建了统一数据湖、统一技术平台,支撑油气勘探、油气开发、协同研究、生产运行、经营管理、安全环保、工程技术、数字政务八大通用业务应用,遵循“一朵云、一个湖、一个平台、一个门户”建设原则,实现上游全业务链的协同共享。
共创 共建 共享 共赢
梦想云生态建设,以构建四大生态为基础(互信运营生态、开放数据生态、智能应用生态、多云互联生态),打造共创、共建、共享、共赢生态圈。