借助人工智能技术,近年来OCR性能的不断提升为产业数字化催生出的更复杂的OCR应用场景提供了坚实支撑。同时,覆盖手机、电子产品以及云服务在内的更加多样化的服务载体,进一步加快了OCR的普及,持续向社会生产生活的更多领域渗透。
一、新基建带来新机遇,OCR技术发展的三大方向
OCR是光学字符识别(Optical Character Recognition)的缩写,指利用机器将图像中手写体或印刷体的文本转换为计算机可以直接处理的格式。作为计算机视觉领域的重要分支,OCR典型应用是通过图像文字识别实现信息录入。同时,由于文字和符号包含丰富的语义信息,基于OCR提取文字信息继而进行分析,能够帮助机器更好地理解图像。
尤其是去年4月,国家发改委明确将人工智能基础设施列入“新基建”范围,作为人工智能应用中最接“地气”,商业推广较为成熟的领域,OCR产业在“新基建”背景下无疑将迎来新的发展机遇,相关技术也将迎来新一轮的变革。
权威报告指出,OCR技术未来发展的三大方向主要包括一体化的端到端OCR模型、兼具高性能高效率的OCR、从感知到认知的智能OCR。
具体来说,构建一体化的端到端网络,同时对文字检测和识别进行训练,将成为OCR技术发展的重要趋势之一。另外,从感知到认知的智能OCR来说,OCR技术通常从计算机视觉领域出发,未来与自然语言处理技术、知识图谱等更广领域的交叉融合,通过语义及知识的深度挖掘提升OCR性能是重要趋势。
二、市场规模高达133.81亿美元,OCR大规模渗透
目前,OCR技术已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。未来随着传统行业的数字化转型,OCR应用范围和场景将进一步扩展,市场规模