vgg16从头训练loss不变的解决方法

最新推荐文章于 2024-06-06 08:15:05 发布

「已注销」

最新推荐文章于 2024-06-06 08:15:05 发布

阅读量6.2k

点赞数 6

分类专栏：坑

本文链接：https://blog.csdn.net/sugarfreewang/article/details/93976701

版权

在这里插入图片描述
从头开始训练，会碰上loss=-ln(类别数)的情况，例如二分类问题loss恒等于0.69，四分类分体loss恒等于1.386推测是由于权重变成NaN之后通过fc变成相同的数导致最终每类的概率相同。
将参数的“gaussian”初始方式修改为“xavier”, 否则训练的时候可能不会收敛。参数的初始化方式很重要。

convolution_param {  
   num_output: 64  
   pad: 1  
   kernel_size: 3  
   weight_filler {  
     type: "xavier"  //将每个weight_filler处的gaussian修改成xavier
   }

参考文献：

https://github.com/NVIDIA/DIGITS/issues/159#issuecomment-247707549
https://github.com/NVIDIA/DIGITS/issues/535

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

6
点赞
踩
20

收藏

觉得还不错? 一键收藏
18
评论
vgg16从头训练loss不变的解决方法

从头开始训练，会碰上loss=-ln(类别数)的情况，例如二分类问题loss恒等于0.69，四分类分体loss恒等于1.386推测是由于权重变成NaN之后通过fc变成相同的数导致最终每类的概率相同。将参数的“gaussian”初始方式修改为“xavier”, 否则训练的时候可能不会收敛。参数的初始化方式很重要。convolution_param { num_output: 64...
复制链接

扫一扫