OCR核心技术主要包括:单行识别引擎和文本行检测技术。有了这两类核心技术即可以实现大部份OCR应用场景项目定制开发。
我们公司的单行识别引擎采用了CNN+LSTM+CTC架构的深度学习技术实现,通过基于残差的CNN+LSTM进行特征提取,再采用CTC实现识别解码工作,这是目前主流的OCR识别架构
国产化麒麟系统OCR、支持龙芯、飞腾CPU
企业在业务过程中,会出现大量的纸质文件,比如单据、发票凭证、与客户、供应商的往来文件、市场情报等。在这种时候公司就会很难处理这些文件,那么这时候我们的文档OCR识别功能就派上用场了。
文档OCR识别可以解决纸质文档在管理和使用上存在诸多问题:
1、存放纸质文档,需要占据大量的空间
2、查看、检索、分享、统计存在诸多不便
3、抗灾难性差,容易损坏
4、需要额外的管理设备和人力资源开支
文档OCR识别可以使纸质文档的电子化,不同企业有不同的需求。但通常分如下几种:
海量纸质文档电子化入库---海量纸质文档电子化,转换成电子文档,能够集中存储,方便查看、借阅等操作使用扫描文档自动OCR文字识别和搜索---对于