OCR概况_CodingPark编程公园

TEAM-AG

于 2020-10-16 08:51:43 发布

阅读量339

点赞数

分类专栏： NLP学习之路机器学习文章标签：神经网络机器学习人工智能

版权由TEAM-AG团队所有

本文链接：https://blog.csdn.net/weixin_38411989/article/details/109101614

版权

NLP学习之路同时被 2 个专栏收录

41 篇文章 10 订阅 ¥79.90 ¥99.00

订阅专栏

14 篇文章 1 订阅

订阅专栏

本文介绍了OCR（光学字符识别）的基本概念、应用背景和技术流程，重点讲解了图像预处理的进化，包括传统的数字图像处理方法和现代深度学习方法。接着，文章探讨了文字检测的技术，如Faster R-CNN和CTPN，以及文本识别的最新进展，如CRNN。最后，提到了端到端OCR系统FOTS如何将检测和识别整合到同一工作流程中，提高了效率和准确性。

摘要由CSDN通过智能技术生成

OCR是什么？

简介

OCR 光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。

应用背景

OCR 可以对海报、身份证等信息进行内容识别。

技术原理及流程步骤

在这里插入图片描述

图像预处理：通常是针对图像的成像问题进行修正。常见的预处理过程包括：几何变换（透视、扭曲、旋转等）、畸变校正、去除模糊、图像增强和光线校正等

文字检测

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

TEAM-AG 编程公园：输出是最好的学习方式

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。