吴恩达《深度学习专项》笔记（八）：如何降低误差以达成优化目标

大局观选手周弈帆

已于 2022-07-24 00:41:12 修改

阅读量792

点赞数 1

分类专栏：吴恩达深度学习文章标签：深度学习机器学习人工智能

于 2022-07-24 00:37:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a119334/article/details/125954894

版权

本文介绍了如何在深度学习中通过正交化策略和设置目标来优化模型，强调了单一指标的重要性，并探讨了开发集、测试集的选择与大小。此外，文章还讨论了与人类级表现的比较，以及如何理解和利用可规避偏差来提升模型表现。

摘要由CSDN通过智能技术生成

经过了之前的学习，我们学会了许多改进深度学习模型的方法，比如：

收集更多数据
收集更多样化的数据
延长训练时间
用高级梯度下降算法
缩小/扩大网络
使用正则化
……

这么多方法，如果只是一个一个试过去，开发效率就太低了。在未来的两周，我们会学习一些改进机器学习的策略。这些策略会给我们一些启发性的指导，让我们在改进模型时更明确下一步该做什么。

学习提示

这周课没有太多的新内容，主要是拓展了第二门课第一周有关偏差与方差分析的内容。学完了这周的课后，大家会进一步了解如何在一个全新的机器学习任务上设置目标，并通过误差分析等技术逐步靠近目标。

课堂笔记

正交化

如何从众多的改进方案中选择出优先级较高的呢？让我们先看看生活中一些其他事情的例子：

首先，是调整老式电视机的例子。老式电视机的画面不一定恰好能端端正正地填满屏幕，需要人为地调整画面的位置。一般这些电视机都有很多按钮，每个按钮各负责一项调整功能，比如调整上下位置、左右位置、缩放、旋转等。每个按钮之间的功能互不干扰。

另外，还有一个开汽车的例子。汽车最少有三种操作：转方向盘、加速、减速。只需要组合这三种操作，我们就能让汽车沿着某一路线跑起来。而如果汽车只有两个可以左右调整的按钮，一个按钮控制0.3倍的角度和-0.8倍的速度，另一个按钮控制2倍的角度和0.9倍的速度，那司机控制汽车时肯定会倍感吃力。

以上两个例子显示了正交化的好处。正交可以指数学里两条直线垂直，这里指的是两个调整方向互不干扰。通过调整正交的参数，我们可以把事物的“坐标分量”逐个调整到我们期待的“位置”。

类似地，在改进机器学习项目时，也可以使用正交化。

在机器学习项目中，大概有4个“坐标分量”需要调整：拟合训练集、拟合开发集、拟合测试集、提升实际应用中的表现。对于这每一项目标，我们都应该使用相互正交的策略去调整，比如：

拟合训练集 - 用更大的网络
拟合开发集 - 正则化
拟合测试集 - 用更大的开发集
提升实际应用中的表现 - 更换损失函数

值得一提的是，提前停止是一个即会影响训练误差，又会影响开发误差的方法。这个方法不满足正交化的要求，使用此方法时需要多多注意。

设置目标

单一指标

在分类任务中，一般有下面这两种评价指标：

精确率（precision, 又称查准率）：所有识别为猫的图片中，究竟有多少确实是猫？
召回率（recall, 又称查全率）：所有猫的图片中，有多少猫被正确识别了？

注意，我们之前代码实战中用的准确率(accuracy)和精确率(precision)不是一个指标。

现在，假设有两个模型，它们在开发集上的评估结果如下：

模型1：精确率95%，召回率90%。
模型2：精确率98%，召回率85%。

二者在精确率和召回率上各有优劣，该怎么从中选一个更好的模型出来呢？

设置目标的一个原则是：只使用单一实数作为评价标准。因此，我们要想办法用一个指标把这两个指标都考虑进来。比如使用F1-score，它的公式如下：

最低0.47元/天解锁文章

大局观选手周弈帆

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
吴恩达《深度学习专项》笔记（八）：如何降低误差以达成优化目标

我们经常能看到AI与人类比较的新闻什么AlphaGo在围棋上战胜人类了，什么在ImageNet上AI的分类准确率超过了人类啊，等等。除了博眼球的新闻外，业内同样也会时常将机器学习模型和人类比较。这是为什么呢？在许多任务中，人类的表现都非常出色。当AI超过了人类后，往往也达到了这类问题的最优精度。获取人类标注的数据。从手动误差分析中获得启发为什么人就能做对？更好地分析偏差与方差。其中，第1条是显然的，第2条会在下周介绍。接下来，我们看看第3条是怎么回事。正交化目标单一指标。......
复制链接

扫一扫

专栏目录

大局观选手周弈帆 CSDN认证博客专家 CSDN认证企业博客

码龄12年

南洋理工大学

31: 原创

8万+: 周排名

128万+: 总排名

3万+: 访问

: 等级

413: 积分

2363: 粉丝

84: 获赞

22: 评论

242: 收藏

私信

关注

热门文章

分类专栏

最新评论

天才程序员周弈帆入驻CSDN
奥雷里亚诺布恩迪亚: 我被扩散模型困住了。阅读了n篇文章之后发现了学长这篇。各种数学原理真的讲的非常透彻完美预测到了我的每一个疑惑。点进作者博客一看，刚参加了24cvpr，膜拜一下。看一下自我介绍，居然是bit的学长。于是又百度人肉了一下。看见您写的“但是把生硬的知识讲懂的人，很少”，我真的泪目了。谢谢学长对于扩散模型的详细介绍
天才程序员周弈帆入驻CSDN
godx@gpcv: 彳亍，genius
Neural Style Transfer 风格迁移经典论文讲解与 PyTorch 实现
weixin_42166878: 老师，可以只拟合风格，不拟合内容吗，就是只改变配色，而不改变内容。请问这样可以实现吗
torch.conv2d 参数解析与 NumPy 复现
佛珠散了一地: 大神知道原来的pytorch版本的conv2d实现的代码在哪里么
吴恩达《深度学习专项》笔记+代码实战（三）：“浅度”神经网络
m0_62236639: 写的太好啦🤩本来很苦恼，看到博主的笔记一下豁然开朗，而且心情也变好了哈哈哈哈感谢博主

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。