深度网络训练技巧

最新推荐文章于 2023-06-29 11:21:08 发布

qq_43518737

最新推荐文章于 2023-06-29 11:21:08 发布

阅读量289

点赞数

文章标签：网络深度学习机器学习

本文链接：https://blog.csdn.net/qq_43518737/article/details/122469024

版权

网络训练图示

在这里插入图片描述

model bias问题：网络模型太简单，不能很好的拟合输入数据的分布函数
optimization问题：网络具有拟合输入数据分布函数的能力，但是优化参数时没有收敛到最优值，使得模型的训练集上的错误率高
如何判断是model bias还是optimization的问题：首先增加网络复杂度，如果随着网络复杂度增加网络在训练集上的错误率降低，说明原始网络有model bais的问题。当网络复杂度增加到一定程度，会出现错误率提高的现象，原因有两个可能：overfitting和optimization
如何判断overfiting和optimization:需要同时查看模型在训练集和测试集上的准确率。单独比较20-layer和56-layer网络在测试集上的准确率，如果56-layer网络在测试集上准确率高于20-layer网络在测试集上的准确率，不能简单得出56-layer网络过拟合的结论，前提是两个网络模型在训练集上已经收敛到最优值。这时需要查看56-layer和20-layer网络在训练集上的准确率，如果56-layer网络在训练集上的识别准确率低于20-layer网络准确率，则存在optimization问题。

关注