用神经网络进行回归预测 weight_decay为异常值（大于1 的值）模型效果好的原因解析

最新推荐文章于 2023-07-31 18:44:13 发布

B站：阿里武

最新推荐文章于 2023-07-31 18:44:13 发布

阅读量4.4k

点赞数 2

分类专栏：解决方案文章标签：回归神经网络算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq874455953/article/details/123503477

版权

解决方案专栏收录该内容

14 篇文章 0 订阅

订阅专栏

weight_decay越大越好的原因

研究发生的问题特此记录

之前在用神经网络来做一个回归问题，回归的数值范围是0~1之间。然后进行网格搜参（搜索最好的weight_decay和学习率）的时候发现一个不合常理的现象，就是一般往往最好的weight_decay 一般是很小的一个数值（0.001或者0.0001），但是我的最优weight_decay反而很大，这就给我造成很大的困扰，还好经过一番探索，最终锁定了问题，下面我将一一道来

现象

发现weight_decay 取得一个比较大的值的时候模型效果最好

请添加图片描述

分析

这显然是不合理的 weight _decay 往往是小于1，一般取10^-3 这种数量级没道理这么大，而且最好的结果出现在这里显然是不合常理的

原因

首先weight _decay本质上是一个L2正则化系数

请添加图片描述

可以理解为加上这个L2正则化，会限制模型的权重都会趋近于0（理解就是当w趋近与0时， w平方和会小，模型损失也会变小），而weight_decay的大小就是公式中的λ，可以理解为λ越大，优化器就越限制权重变得趋近与0

这里重点注意

由于我模型最后输出的是一个0~1的结果，而神经网络的最后一次输出是一个 权重之和，这就要求我们得到的权重必然是要比较小的才能符合输出结果

也就是图中的w1 w2 w3 w4 要趋近于0，这样加权值才会比较小

实验分析

经过上面的原理分析，于是我做了下面两组实验

当weight_decay 设置为1时，模型的参数迭代如下

请添加图片描述

当weight_decay 设置为0.001时，模型的参数迭代如下

请添加图片描述

可以明显看出 weight_decay 越大，模型权重则会在训练地越小，这说明在我们模型中确实需要设置这么大的weight_decay

但是我查看发现竟然需要是的权重变成10^-4 次方，是不是有点过于小了，我通过全连接层计算，理论上也就是只有1500个权重和，乘上10的-4次方的权重范围反而应该小于0.15。而且其他这样做也没有出现这么大的weight_decay。

经过查找。我最终发现了原因，原因是在真实值输入的时候，为了使得loss更大一点，我将每个真实值都放大100倍，也就是说输出的范围是0~100, 这就更加加重了我模型需要学习到更趋近于0的权重，也可以和我前面分析出权重为什么过于小对于上来，问题解决！

请添加图片描述

总结

最终问题是解决了，将模型放缩100取消后，weight_decay也成为了一个正常值

请添加图片描述

教训是

别瞎改改输出格式
从公式根源出发寻找问题
学会打印模型参数来查问题
神经网络不好做回归，使得权重很小
或许多加几层由于层数的增加使得输出变小，可能会缓解这种问题

其实也是一种启发：神经网络做回归，需要考虑权重问题，不能像做传统分类问题一样，因为传统分类会经过sigmoid函数来进行概率变换，

Sigmoid 曲线

就算很大或者很小的输出值，也会被合理的放缩到0~1之间，不用考虑权重值过大或过小的问题

B站：阿里武

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
用神经网络进行回归预测 weight_decay为异常值（大于1 的值）模型效果好的原因解析

weight_decay越大越好的原因研究发生的问题特此记录之前在用神经网络来做一个回归问题，回归的数值范围是0~1之间。然后进行网格搜参（搜索最好的weight_decay和学习率）的时候发现一个不合常理的现象，就是一般往往最好的weight_decay 一般是很小的一个数值（0.001或者0.0001），但是我的最优weight_decay反而很大，这就给我造成很大的困扰，还好经过一番探索，最终锁定了问题，下面我将一一道来现象发现weight_decay 取得一个比较大的值的时候模型效果最好
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。