【机器学习算法】神经网络与深度学习-7 DNN深度学习算法模型出现学习效果不好的情况，如何补救，对策如下，建议收藏

最新推荐文章于 2024-07-19 16:33:18 发布

2401_84159839

最新推荐文章于 2024-07-19 16:33:18 发布

阅读量512

点赞数 10

分类专栏：程序员文章标签：机器学习神经网络深度学习

本文链接：https://blog.csdn.net/2401_84159839/article/details/138343870

版权

程序员专栏收录该内容

188 篇文章 0 订阅

订阅专栏

本文介绍了深度学习中遇到效果不佳时的应对策略，包括选择适当的损失函数（如CrossEntropy）、使用Mini-Batch训练、更换激活函数（如ReLU）、调整学习率以及应对过拟合的方法（如dropout）。

摘要由CSDN通过智能技术生成

目录

深度学习效果不好的对策

训练数据效果不好的情况，采用什么对策

方法1：proper loss

方法2：Mini-Batch

方法3：采用new activation function

方法4：Adaptive Learning Rate

测试数据效果不好的情况，采用什么对策：

方法1：Early stopping

方法3：dropout

我的主页：晴天qt01的博客_CSDN博客-数据分析师领域博主

目前进度：第四部分【机器学习算法】

深度学习效果不好的对策

我们训练一个普通深度学习网络(Deep Nural Networks DNN)的时候很难一帆风顺直接达到最好结果，虽然它和BP神经网络很像，但是它有自己独特的参数调整方法，这里对各种学习效果不好情况，提供对策。

DNN的其他设置。设定一个学习目标，然后利用梯度下降法，训练好神经网络。用训练数据训练这个网络，然后再用测试数据进行训练。如果训练数据的的结果都不好的话，就直接把这个模型重新建模。那就没有必要去跑测试，如果训练数据结果不错，就可以通过测试数据测试结果如何，如果测试数据结果不好，说明训练数据建模的模型出现过拟合现象。就要考虑减少层数，如果测试结果和训练结果都不错，那就说明，效果都不错。

根据情况的不同，调整参数。有些参数是用来解决测试数据效果不好的问题，有些数据是用来解决训练数据效果不好的问题，

比如egdropout就是用来解决泛化能力不好的问题。

训练数据效果不好的情况，采用什么对策

方法1：选择其他误差处理方法：proper loss

方法2：Mini-batch

方法3:使用新的激活函数，选择一个合适的激活函数能帮你把total loss下降的更低。

方法4：学习速率的调整learning rate 调小学习速率，增加精确值，或者使用动态学习速率的。调整

方法5：因为我们平时都只能找到局域最优解，而很难找到全域最优解，momentum，利用动量的方式跳里原先的最小值的范围，让找到全域最优解得到可能性变大。

方法1：proper loss

我们神经网络的误差优化方法一般使用的都是Square Error，利用实际值和输出值的平方差来进行误差调整，都是既然我们测试集的数据错误率很高，我们就可以采用不同的误差公式计算，比如Cross entropy=就是对每一项都用目标字段的值乘以输出字段取自然数为底对数的对数值的累积求和，（含义就是，当你标准字段上得到值越大，entropy得到值就会越小，只考虑，标准答案的概率值。

因为我们的输出字段都是0~1之间，所以要在entropy的数值上乘以-1

当目标字段和输出数值的值相同时，二者的值都会为0

当我们使用softmax layer的时候，使用 cross entropy的效果就会比较好。

可以看看下面附带的这篇论文：

在softmax layer 的前提条件下，我们发现cross entropy的斜率要比 square error 误差值的斜率要大的多，如果求微分，系统可以马上知道我误差下降的方向是那边。如果我们看图中的蓝色点，如果是square，它的误差是平的，往左往右它是无法判断的。就会导致不调整权重值。或者只是微微调整，那如果没有达到最小的误差值，就会导致效果差了，cross entropy做梯度下降法的时候它的下降速度很快，而且能明确下降的方向

用折线图表示二者的差距就可以明显发现了