15.OCR

最新推荐文章于 2024-06-14 11:34:45 发布

秃头少女Emily

最新推荐文章于 2024-06-14 11:34:45 发布

阅读量441

点赞数

分类专栏：吴恩达机器学习(Andrew Ng的公开课) 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45276194/article/details/131390509

版权

吴恩达机器学习(Andrew Ng的公开课) 专栏收录该内容

15 篇文章 2 订阅

订阅专栏

15.1 OCR流水线及七工作原理

Photo OCR：照片光学字符识别(photo optical character recognition)

Photo OCR注重的问题：如何让计算机都出图片中的文字信息，它有以下步骤：

首先给定某张图片，它将图像扫描一遍，然后找出照片中的文字信息。
成功找出这些文字以后，它将重点关注这些文字区域，并对区域中的文字进行识别。当正确读出这些文字以后，它会将这些文字内容显示并记录下来。

如何实现OCR？

首先我们要扫描图像，并找出有文字的图像区域（文字检测）
对有文字的图像区域进行文字分离（字符分割）
分割这些文字得到独立的字符后，使用一个分类器，它会对这些可见字符进行识别，最后就可以得到文字信息（字符分类）

这样的步骤就成为了机器学习流水线。

15.2 滑动窗口分类器

15.3 人工数据合成

从零开始创造新数据
从已有的小的标签训练集，以某种方式扩充训练集

获取数据：

下载字体，然后将它们放到一个随机北京图片上

对图像进行人工扭曲

对语音文本加入不同的背景干扰

首先确保算法已经有很低的偏差，整体的模型ok，然后在考虑加数据，否则只是徒劳。

然后考虑加数据的人工和时间成本。

15.4 上限分析

对多个模块进行分析，让其中一个模块达到100%的准确率，然后判断它能提高整个系统多少准确率。

秃头少女Emily

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
15.OCR

Photo OCR：照片光学字符识别(photo optical character recognition)如何实现OCR？这样的步骤就成为了机器学习流水线。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

秃头少女Emily 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。