Datawhale X 李宏毅苹果书 AI夏令营 Task3 深度学习详解 -2 机器学习框架攻略

Just right

已于 2024-09-03 14:02:30 修改

阅读量252

点赞数 1

文章标签：机器学习深度学习

于 2024-09-01 18:53:06 首次发布

本文链接：https://blog.csdn.net/qq_45418837/article/details/141788108

版权

实践方法论

如下图所示

再来看另外一种情况

这个集合包括了一些函数，其中有损失低的函数，但问题是梯度下降这种办法找不到损失低的函数，只能找到局部解，找不到最优，就是找到一个就返回，但可能返回的这个解不是最优解

接下来我们来思考：

这里书里面提到了一种判断方法，即通过比较不同的模型来判断模型现在到底够不够大。
通过下面的这张图可以看出来20层的效果在测试数据和训练数据上面都要比56层要好，也就是说优化不到位，因为按理来说20层能做到的事情，56层应该也可以做到且做的更好，要不然那36层干什么用的？

在这里插入图片描述

这里他提到的建议是
在这里插入图片描述

我这里看的很蒙，就记录一下自己的理解

即先用比较小的、比较浅的网络确保这些网络和模型能找到一组最好的参数，记录一下这些模型的损失值，接下来上深的模型，若，深的模型明明灵活性比较大，但损失却没有办法比浅的模型压得更低代表说优化有问题，梯度下降不给力，因此要有一些其它的方法来更好地进行优化。

增加训练数据：说人话就是做题太少了，没有学到真东西，加大剂量
简化模型：别只会一种解题方法，如果模型只会一种“解题方法”，遇到新的题目就会束手无策，所以让它能够尝试多种“解题方法”，这样才能更好地应对各种情况。
正则化和Dropout:正则化：对模型参数施加惩罚，防止模型过度拟合训练数据，dropout：在训练过程中随机丢弃一些神经元，防止模型过度依赖某些特征。
说人话，正则化和dropout就是为了防止孩子只知道刷题，而不知道思考就会变成“书呆子”，这里的”书呆子“可以理解为过拟合了
交叉验证：使用一部分数据作为验证集，评估模型在未见数据上的表现，避免过拟合，说人话，如果学生只会自己一个人学习，就会变成“井底之蛙”。同样，如果模型只使用训练数据，就会失去泛化的能力。我们需要使用交叉验证等方法，让模型“多和同学交流”，学习到更全面的规律。