1.9学习日志

最新推荐文章于 2024-09-14 21:53:48 发布

最爱是小麻花

最新推荐文章于 2024-09-14 21:53:48 发布

阅读量233

点赞数 5

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_76247111/article/details/135476062

版权

本文介绍了权重衰退作为一种解决过拟合问题的技术，通过L2正则项限制模型参数，减少复杂度。通过反向传播和梯度下降的代码示例，展示了如何在训练过程中加入权重衰减，以及不同λ值对过拟合和模型权重的影响。

摘要由CSDN通过智能技术生成

14权重衰退

1.理论概念

权重衰退是一种处理过拟合问题的方法

控制模型复杂度：通过限制参数值的选择范围来控制模型容量

最小化目标函数损失，并且对于参数权重w进行限制

最常用的是以下这种（较好计算）：

使用均方范数作为柔性限制

当λ趋近于无穷时，w趋近于0，等价于硬性限制中的Seita趋于零

在原本的损失函数后面添加的项叫做阀，如果没有阀原本绿色的圈就是损失函数l的等高线，中心店w的位置是最优解，如果加上阀，此时的阀值就会很大，必然就不再是最优解，因此最优解会向原点的方向靠近，w的值就会减小，也就限制住了参数w的选择范围

参数更新法则

相比原来展开时间t更新参数函数后，增加的项就是ηλ，因此在每一次更新参数之前，都会给原来的参数先乘一个小于1的数将其缩小

每一次更新都会把当前的权重放小

总结：L2正则项权重w是控制模型复杂度的一个超参数

权重衰退控制模型复杂度

2.代码实现

补充遗忘知识点：反向传播，梯度下降

反向传播：
反向传播是计算梯度的过程，它从损失函数开始，通过链式法则逐层计算每个参数的梯度。下面是反向传播的具体步骤：

a. 计算损失函数对输出的梯度：
首先，根据损失函数的定义，计算损失函数对模型输出的梯度。对于常见的平方损失函数，该梯度可以通过预测值与真实值之间的差异来计算。

b. 反向传播梯度：
从最后一层开始，将损失函数对输出的梯度传递回每一层。对于每个层，需要计算两个梯度：对于输出的梯度和对于权重的梯度。

c. 计算梯度：
对于前一层的每个节点，根据链式法则计算其对应的梯度。这可以通过将当前层的梯度与当前层的权重相乘来实现。

d. 更新参数：
在计算了所有参数的梯度之后，可以使用优化算法（如随机梯度下降）根据梯度更新模型的参数。通过将参数沿着梯度的反方向移动一小步，可以逐渐减小损失函数，使模型更好地拟合数据。

计算梯度是为了向着损失函数更小的方向靠近

结果：

1>当阀值为0，

可以看到验证集test几乎没变，出现了严重的过拟合

2>当阀值不为0 ，将λ值调大后，λ=15

过拟合的的现象有效减小，w的L2范数是： 0.022098073735833168，权重值也减小

问题总结：

1.如果本身最优解偏大，加上权重衰退后让权重变小，偏离最优解？

ANS：加入正则项，不是为了找到最优解，而是为了减小过拟合，减小过拟合之后不一定是最优解。其次权重衰退减小了噪音的影响，可以使模型趋向简单化。最终是需要一个合适的λ值

最爱是小麻花

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

最爱是小麻花

博客等级

码龄2年

30
原创

234
点赞

216
收藏

164
粉丝

关注

私信

热门文章

最新评论

11.1Python学习日志
HyperLink-Officials: 非常棒的学习日志！继续保持写作的热情，分享你的学习心得和经验对其他人也是非常有帮助的。除了你在标题和摘要中提到的内容，我认为你可以进一步探讨一些与Python学习相关的扩展知识和技能。例如，你可以介绍一些Python的内置函数和常用库，比如math库用于数学运算，datetime库用于日期和时间处理等等。此外，你还可以探索一些面向对象编程的基本概念和用法，如类、对象、继承和多态等。当然，这些只是我个人的建议，你可以根据自己的兴趣和学习进度来选择适合的内容。再次感谢你的分享，期待看到更多精彩的博文！加油！
11.27学习日志
CSDN-Ada助手: 恭喜您写了第19篇博客！您的学习日志一定对许多人都有所帮助。希望您能继续保持创作的热情，不断分享学习心得和经验。或许下一步可以尝试结合实际案例或者引用专家观点，来丰富您的内容，让读者能够更加深入地了解您的主题。期待看到更多精彩的作品！
11.16学习
CSDN-Ada助手: 恭喜你，第14篇博客"11.16学习"的发布！持续创作是非常难得的品质，你的努力和坚持值得称赞。通过你的博客，我可以感受到你对学习的热爱和执着，这非常令人鼓舞。在下一步的创作中，或许你可以更加深入地探讨11月16日的学习心得体会，或是分享一些学习方法和技巧，这样能够帮助到更多的读者。同时，你也可以考虑加入一些个人观点和见解，让你的博客更具独特性和深度。继续保持谦虚的态度，虚心倾听读者的反馈和建议，这样你的博客将不断进步，为读者带来更多的收获和启发。期待你未来更多精彩的创作！
11.15学习
CSDN-Ada助手: "恭喜你能够持续不断地创作博客，11.15学习这篇博客内容丰富，让人受益匪浅。希望你能够继续保持这样的创作热情，不断提升自己的写作水平。或许下一步可以尝试写一些与学习方法、心得体会相关的内容，这样可以让读者更加深入地了解你的学习经验。期待你的下一篇作品！"
11.14学习
CSDN-Ada助手: “恭喜你在11.14学习的博客已经写到了第12篇，真是不容易啊！继续保持创作的热情和努力，我觉得你可以尝试更多不同的学习方法和主题，或许可以让读者有更多的收获。加油！”

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。