训练网络---train loss从一开始就不变

最新推荐文章于 2024-06-29 16:53:05 发布

KORIYN

最新推荐文章于 2024-06-29 16:53:05 发布

阅读量3.9k

点赞数

分类专栏：代码记录文章标签：深度学习 python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42037837/article/details/105640444

版权

代码记录专栏收录该内容

4 篇文章 0 订阅

订阅专栏

训练网络—train loss、test loss,accuracy从一开始就不变

在训练NTSNet的时候，使用了vgg_16bn的baseline，将其设置为unpretrained的时候，发现vgg文件使用了默认的kaiming初始化。
但遇到这样一个问题：把此时的vgg_16bn的参数全部打印处理，它有很多层的w权重为接近0的特别小的数，导致数据变化的程度不足以影响得到的结果。

**train loss不变的情况，一般是因为前馈网络中的有些地方的参数很大或者很小，致数据变化的程度不足以影响得到的结果。**明确前馈网络哪个地方出现这个情况，特别是对源代码进行改动的地方。

在这里可以看到，假设对于一个样本的train，w太小，z小，a接近0，每一次都是这样。损失函数基本不变，梯度更新小。
对于2分类问题，训练集有9924张照片，每一次a接近0，会把所有的样本预测为同一类，导致accuracy为1个定值。

最后，不得不说，鼎文大佬就是NB！！！！！！！！！！

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
训练网络---train loss从一开始就不变

训练网络—train loss、test loss,accuracy从一开始就不变在训练NTSNet的时候，使用了vgg_16bn的baseline，将其设置为unpretrained的时候，发现vgg文件使用了默认的kaiming初始化。但遇到这样一个问题：把vgg_16bn的参数全部打印处理，它有很多层的w权重为接近0的特别小的数，导致数据变化的程度不足以影响得到的结果。**train ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。