【学习笔记】AI全栈成长计划-AI应用篇-第一章：企业应用最广泛的AI案例开发 OCR文字识别

真爱无敌86

于 2021-12-23 10:09:15 发布

阅读量203

点赞数

分类专栏：华为云文章标签：人工智能深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dongzhumao86/article/details/122100663

版权

华为云专栏收录该内容

13 篇文章 1 订阅

订阅专栏

1、OCR简介

光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。

2、OCR应用场景

1）针对图片类识别

2）文档类识别场景

3）拍照表单类场景

4）自然场景（比如车牌识别、摄像监控、自动驾驶等）

3、OCR流程

图像预处理：去噪、灰度化、图像增强等

文本检测：滑动窗口算法遍历整张图片

常见的算法包括： Faster R-CNN、FCN、RRPN、TextBoxes、 DMPNet 、 CTPN、 SegLink

字符分类：划分单个字符，识别单字

文本识别：引入上下文的信息，成为了提升条目准确率的关键

4、华为云OCR端到端OCR流程

1）准备一张含有文字的原图

2）对原图进行文字位置的监测，检测结果可能是水平矩形框，也可能是倾斜矩形框

3）从原图中把文字框对应的图片切下来，并旋转正，得到水平的文字块切片图

4）对每个文字块切片图依次进行字符识别，每个切片图的识别结果汇总起来，就得到原图的文字识别结果

总结：输入原图->文字检测->文字块切片->字符识别->识别结果汇总

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【学习笔记】AI全栈成长计划-AI应用篇-第一章：企业应用最广泛的AI案例开发 OCR文字识别

1、OCR简介光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。2、OCR应用场景1）针对图片类识别2）文档类识别场景3）拍照表单类场景4）自然场景（比如车牌识别、摄像监控、自动驾驶等）3、OCR流程图像预处理：去噪、灰度化、图像增强等文本检测：滑动窗口算法遍历整张图片常见的算法包括：Faster ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。