深度学习OCR文档识别

本文对比了传统的文档OCR技术和深度学习OCR技术。传统OCR识别横排、竖排文本、表格和配图,适合各类文档;而深度学习OCR在复杂背景识别上有优势,更适合非文档类的场景,如广告海报文字。然而,深度学习OCR对硬件要求高,主要输出行、列文字信息。
摘要由CSDN通过智能技术生成

 传统的的文档OCR文字识别技术,他是有对图片上的内容进行认识分析的过程,其中比较重要的就是有个四要素,横排文本、竖排文本、表格、配图;每一个作者所写的材料,文章等文件中都是由这四个基本要素组成。

在传统的文档OCR识别技术中,算法会先分析图片中有几个布局区域,然后分析出水平横向文字,竖向垂直文字,表格和配图照片等区域,然后在针对各自的特点进行切分字符,保留区域类型,进行OCR识别调整;所以可以适应各种类型的文本识别。有些小角度的倾斜文本,OCR程序也可以进行智能调整识别;

深度学习的OCR技术是最近一年兴起来的,这个技术的抗干扰能力很强,可以识别比较复杂背景情况下的图片,但是现在的深度OCR识别技术并没有专门的公司去做深度研究和技术演练,目前的情况是可以很好地输出“行文字信息”以及“列文字信息”,所以如果想用深度学习的OCR技术去处理文档资料的话,会很不合适!

文档OCR识别与深度学习OCR技术应用分析

但是如果用来处理各种非文档类型的,场景照片中文字,广告海报中的文字,那么深度学习技术的OCR程序就会很有优势,如果您想做这方面的技术应用,就需要配备一台显卡比较牛的服务器,因为深度学习的技术跑的是GPU,对显卡的等级要求很高,不像跑CPU的传统OCR文字识别技术。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值