怎么看神经网络过早收敛_深度学习训练网络中，test loss比training loss早很多收敛，迭代次数要怎么取？...

最新推荐文章于 2024-06-16 08:00:00 发布

weixin_39576270

最新推荐文章于 2024-06-16 08:00:00 发布

阅读量3.2k

点赞数 1

文章标签：怎么看神经网络过早收敛

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39576270/article/details/114018016

版权

本着实事求是的态度总没有错。我们的目标就是用网络模型做出更好的预测效果，所以能实现这个目标的方法都是好方法。

以下列举了一些迭代次数判断的方法：

01 当loss值收敛时结束迭代

深度学习的一个关键原理就是比较学习结果和样本标签之间的差距。理论上差距越小，表明学习的效果越好。这个差距就是loss值。

Loss值不可能变为0，只能无限逼近0。所以通过脚趾都能想到，当loss值无法变小的时候，这称为收敛，就是学习结束之时。

02 使用验证集来检验训练成果

深度学习常常会遇到一个问题——过拟合。训练的时候学习效果很好，但是拿到其它地方测试发现效果就不行了。

就是说，并不一定是学习效果最好的时候才停止。那如何来判断停止的时机呢？

有学者提出了验证集。

就是说，把训练集分为2部分，比如70%用来训练，30%用来验证。就像下面的代码。

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.33, random_state=seed)

然后在训练时加入验证的参数，就像这样：

autoencoder.fit(train_data, train_data,

epochs=50,

batch_size=128,

shuffle=True,

validation_data=(noisy_imgs, data_test)

)

然后就是观察验证曲线，什么时候验证的loss值最小，就选那一次的训练模型进行测试应用。

最低0.47元/天解锁文章

weixin_39576270

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
怎么看神经网络过早收敛_深度学习训练网络中，test loss比training loss早很多收敛，迭代次数要怎么取？...

本着实事求是的态度总没有错。我们的目标就是用网络模型做出更好的预测效果，所以能实现这个目标的方法都是好方法。以下列举了一些迭代次数判断的方法：01 当loss值收敛时结束迭代深度学习的一个关键原理就是比较学习结果和样本标签之间的差距。理论上差距越小，表明学习的效果越好。这个差距就是loss值。Loss值不可能变为0，只能无限逼近0。所以通过脚趾都能想到，当loss值无法变小的时候，这称为收敛，就是...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。