机器学习任务攻略

最新推荐文章于 2024-08-31 08:01:24 发布

编程小小白白

最新推荐文章于 2024-08-31 08:01:24 发布

阅读量991

点赞数

分类专栏：笔记文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_45743760/article/details/121471578

版权

9 篇文章 0 订阅

订阅专栏

请添加图片描述

局部最优解
从Testing data上来看，56层的表现不如20层，不是过拟合。检查一下训练资料上的结果，20层和56层对比，56层弹性应该比20层的大，但是表现的却不好，不是模型偏差，而是56层的optimization没有处理好。
Gaining the insights from camparison.
Start from shallower networks(or other models), which are easier to
optimize.
If deeper networks do not obtain smaller loss on training data, then
there is optimization issue.

上面数据中，5层的loss比4层的大，是不科学的，因此是optimization的问题。
Solution：more powerful optimization technology

small loss on training data, large loss on testing data.
An extreme example
如果x存在于训练集，就输出他的标签，否则输出一个随机数。
在这里插入图片描述
更加灵活的模型会导致过拟合的出现。

解决办法

增加训练资料
data augmentation（数据加强）
根据对数据的理解，增加资料。将图片资料翻转，截取其中一部分。注意不要上下翻转（不符合常理，可能会使机器感到奇怪。）
对模型增加限制，不要让他过于灵活。
less parameters, sharing parameters.减少参数,如果是深度学习，就减少神经元的个数。
less features 例如，用前三天的资料预测明天，可以减少为用前两天的资料来预测明天。
early stopping
regularization
dropout

在这里插入图片描述

training and testing data have different distributions.
在这里插入图片描述

训练集：学习样本数据集，通过匹配一些参数建立一个分类器，主要是用来训练模型的。
验证集：对学习出来的模型，调整超参数。
测试集：测试集训练 ,好的模型的准确率

关注

专栏目录