深度学习OCR文档识别

最新推荐文章于 2022-06-10 16:47:28 发布

Tel-18519103264

最新推荐文章于 2022-06-10 16:47:28 发布

阅读量312

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZsHua_18519103264/article/details/117407135

版权

本文对比了传统的文档OCR技术和深度学习OCR技术。传统OCR识别横排、竖排文本、表格和配图，适合各类文档；而深度学习OCR在复杂背景识别上有优势，更适合非文档类的场景，如广告海报文字。然而，深度学习OCR对硬件要求高，主要输出行、列文字信息。

摘要由CSDN通过智能技术生成

传统的的文档OCR文字识别技术，他是有对图片上的内容进行认识分析的过程，其中比较重要的就是有个四要素，横排文本、竖排文本、表格、配图；每一个作者所写的材料，文章等文件中都是由这四个基本要素组成。

在传统的文档OCR识别技术中，算法会先分析图片中有几个布局区域，然后分析出水平横向文字，竖向垂直文字，表格和配图照片等区域，然后在针对各自的特点进行切分字符，保留区域类型，进行OCR识别调整；所以可以适应各种类型的文本识别。有些小角度的倾斜文本，OCR程序也可以进行智能调整识别；

深度学习的OCR技术是最近一年兴起来的，这个技术的抗干扰能力很强，可以识别比较复杂背景情况下的图片，但是现在的深度OCR识别技术并没有专门的公司去做深度研究和技术演练，目前的情况是可以很好地输出“行文字信息”以及“列文字信息”，所以如果想用深度学习的OCR技术去处理文档资料的话，会很不合适！

文档OCR识别与深度学习OCR技术应用分析

但是如果用来处理各种非文档类型的，场景照片中文字，广告海报中的文字，那么深度学习技术的OCR程序就会很有优势，如果您想做这方面的技术应用，就需要配备一台显卡比较牛的服务器，因为深度学习的技术跑的是GPU，对显卡的等级要求很高，不像跑CPU的传统OCR文字识别技术。

Tel-18519103264

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。