吴恩达机器学习笔记：第 10 周-18应用实例：图片文字识别(Application Example: Photo OCR)18.3-18.4

浊酒南街

已于 2024-05-11 10:50:10 修改

阅读量324

点赞数 7

分类专栏： # 吴恩达机器学习笔记文章标签：机器学习笔记 ocr

于 2024-05-11 10:23:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43597208/article/details/138704053

版权

目录

第 10 周 18、应用实例：图片文字识别(Application Example: Photo OCR)
- 18.3 获取大量数据和人工数据
- 18.4 上限分析：哪部分管道的接下去做

第 10 周 18、应用实例：图片文字识别(Application Example: Photo OCR)

18.3 获取大量数据和人工数据

如果我们的模型是低方差的，那么获得更多的数据用于训练模型，是能够有更好的效果的。问题在于，我们怎样获得数据，数据不总是可以直接获得的，我们有可能需要人工地创造一些数据。

以我们的文字识别应用为例，我们可以字体网站下载各种字体，然后利用这些不同的字体配上各种不同的随机背景图片创造出一些用于训练的实例，这让我们能够获得一个无限大的训练集。这是从零开始创造实例。

另一种方法是，利用已有的数据，然后对其进行修改，例如将已有的字符图片进行一些扭曲、旋转、模糊处理。只要我们认为实际数据有可能和经过这样处理后的数据类似，我们便可以用这样的方法来创造大量的数据。

有关获得更多数据的几种方法：
1.人工数据合成
2.手动收集、标记数据
3.众包

18.4 上限分析：哪部分管道的接下去做

在机器学习的应用中，我们通常需要通过几个步骤才能进行最终的预测，我们如何能够知道哪一部分最值得我们花时间和精力去改善呢？这个问题可以通过上限分析来回答。

回到我们的文字识别应用中，我们的流程图如下：

在这里插入图片描述

流程图中每一部分的输出都是下一部分的输入ÿ

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。