达叔的正交化（第三课3.2）

最新推荐文章于 2024-07-29 10:36:01 发布

xiaotian127

最新推荐文章于 2024-07-29 10:36:01 发布

阅读量323

点赞数

分类专栏：竞赛总结达叔

本文链接：https://blog.csdn.net/xiaotian127/article/details/103333284

版权

竞赛总结同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

达叔

1 篇文章 0 订阅

订阅专栏

搭建机器学习系统的挑战之一就是可以尝试和改变的东西太多太多了，如有那么多的参数可以调整。达叔注意到那些效率很高的机器学习专家有个特点，他们思路清晰对于调整什么来达到某个效果，他们非常清楚，这个步骤就称之为正交化。（就像一台老式电视的很多按钮一样，通过调整某一个旋钮来达到自己想要的某种效果）

要搭建一个监督学习系统，通常需要调整旋钮来确保四件事情。首先，应该确保系统在训练集上得到的结果不错，所以训练集上的表现必须通过某种评估达到接受的程度（对于某种评估甚至达到人类水平的表现）；然后再训练集上表现不错时，就希望系统在验证集有好的表现；然后，也希望在测试集上有好的表现；最后，希望系统在现实的实际使用中表现令人满意。

第一种，如果不能很好的拟合训练集，调试的办法有：

训练更大的网络；
或者是切换到更好的优化算法，如Adam优化算法等
达叔说在本周及下周一讲（等我get到后补上）

第二种，如果发现算法对验证集的拟合效果很差，调试的办法有：

可以尝试正则化以使系统满足第二个条件；
可以增大训练集，这也是一种调整方法，可以使学习算法更好的归纳开发集的规律；

补充1：

达叔在可避免偏差(Avoidable bias)这一节中再次提到了前两种情况发生时的解决办法：

如果说模型的training error和bayes error相差相差较大，表明模型的效果不好，解决办法有：先聚焦在减小training error上，如用更大的网络结构，跑久一点梯度下降

如果说模型的training error与bayes error(或者可以近似为人类误差human error)相差很小，但是training error和val error相差很大，表明方差很大，可以考虑减小方差，具体的方法有：正则化、更大的网络结构、更多的训练数据；

可避免偏差：把bayes error和training error之间的差距称为可避免偏差(Avoidable bias)；

补充2：

达叔在第12节改善模型表现这一节中，提出了一个提高算法性能的指导方针，首先提出之前先做两个基本假设：①在正常情况下，模型能够在训练集上表现很好，即可避免偏差很小；②训练表现很好的模型，在验证集和测试集上也可以取得很好的效果，即方差很小。

第一，可避免偏差(bayes error和training error之间的差距)。可以尝试的办法有：训练更大的model、训练更久、用更好的优化算法（如：momentum、RMSprop、Adam等）、寻找更好的新的神经网络结构、更好的超参数（包括改变激活激活函数、改变层数、隐藏层单元数、）

第二，方差(training error和val error之间的差距)。可以尝试的方法有：收集更多的数据（可以更好地推广到系统看不到的验证集数据）、正则化（如l2、Dropout、data augmentation）、超参数搜索等。

第三种，如果在测试集上的效果不好，调试的方法有：