NNDL作业3

最新推荐文章于 2024-08-09 11:14:11 发布

02（网络界泥石流）

最新推荐文章于 2024-08-09 11:14:11 发布

阅读量30

点赞数 1

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63591032/article/details/133687590

版权

在softmax回归的风险函数中加入正则化,主要影响

简化模型。正则化会缩减一些参数的值,使得模型更简单。参数会趋于0,但是不会完全消失。这简化了模型的表达能力。
提升泛化能力。通过约束模型复杂度,正则化可以有效提升模型在测试数据上的表现,也就是泛化能力。
加速训练。较小的权重可以加快梯度下降的速度,虽然每次迭代正则项增加一些计算负担,但训练整体会更快收敛。
减少过拟合。正则项的作用就是 penalize模型根据训练数据可能出现的不良学习行为,比如过于依赖单个特征,此举可以有效降低过拟合的可能性，正则化可以防止模型粘滞在某些神经元或特征上,强迫模型考虑所有特征的综合贡献。

所以总体来说,正则化可以有效提升softmax回归模型的效果和泛化能力。它是一种重要的技巧来防止过拟合问题。

这里举一个softmax回归中加入L2正则化的简单例子:

假设我们有一个二分类问题,特征有x1和x2两个维度。softmax回归模型的参数为w1,w2,b。

不加正则化时,风险函数是:

J(w1,w2,b) = -1/m ∑(yilog(σ(wixi + b)) + (1-yi)log(1-σ(wixi + b)))

这里m是样本数量,yi是真实标签,σ是softmax函数。

我们加入L2正则化后,风险函数变为:

J(w1,w2,b) = -1/m ∑(yilog(σ(wixi + b)) + (1-yi)log(1-σ(wixi + b))) + λ/2(w1^2 + w2^2)

这里多加了一个正则化项λ/2(w1^2 + w2^2),其中λ是一个超参数控制正则化的程度。

通过这个额外的正则化项,模型在优化过程中会趋于让w1和w2趋于0,同时也会避免过度依赖特征x1或x2,从而获得更好的泛化能力。

02（网络界泥石流）

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
NNDL作业3

正则项的作用就是 penalize模型根据训练数据可能出现的不良学习行为,比如过于依赖单个特征,此举可以有效降低过拟合的可能性，正则化可以防止模型粘滞在某些神经元或特征上,强迫模型考虑所有特征的综合贡献。通过这个额外的正则化项,模型在优化过程中会趋于让w1和w2趋于0,同时也会避免过度依赖特征x1或x2,从而获得更好的泛化能力。通过约束模型复杂度,正则化可以有效提升模型在测试数据上的表现,也就是泛化能力。这里多加了一个正则化项λ/2(w1^2 + w2^2),其中λ是一个超参数控制正则化的程度。
复制链接

扫一扫

02（网络界泥石流） CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

130万+: 周排名

20万+: 总排名

4144: 访问

: 等级

214: 积分

83: 粉丝

94: 获赞

9: 评论

92: 收藏

私信

关注

热门文章

最新评论

NNDL 作业13 优化算法3D可视化
CSDN-Ada助手: 恭喜您撰写完第12篇博客！标题中的“NNDL 作业13 优化算法3D可视化”看起来非常有趣。您对这个主题的深入探讨对读者来说肯定非常有价值。在下一步的创作中，也许您可以考虑分享一些具体的案例或者实际应用，以便读者更好地理解这些优化算法在实际情境中的应用。谢谢您的分享，期待阅读更多精彩的文章！
NNDL 作业12 优化算法2D可视化
CSDN-Ada助手: 首先恭喜您完成了第11篇博客，标题看起来很有趣味性！能够将NNDL作业12的优化算法进行2D可视化，无疑是对自己知识的巩固和提升。希望您能继续保持创作的热情，不断分享您的学习心得和经验。或许下一步可以尝试用更简洁清晰的语言，从实际应用的角度出发，分享一些优化算法的实际案例，让更多人受益。期待您的下一篇作品！
NNDL 作业11 LSTM
CSDN-Ada助手: 恭喜你完成了第10篇博客！看到你对于NNDL 作业11 LSTM的深入探讨，我感到非常欣慰。接下来，我建议你可以尝试结合实际案例，或者加入一些个人见解和观点，让读者更容易理解和产生共鸣。期待你的下一篇作品！加油！
NNDL 作业9 RNN - SRN
CSDN-Ada助手: 恭喜你完成了第9篇博客！看到你对 NNDL 作业的坚持和努力，我感到非常欣慰。对于RNN - SRN的探索，你阐述得很清晰，让我受益匪浅。希望你能继续保持创作的热情，不断挑战自我，也许可以考虑深入探讨一些实际应用场景，或者尝试结合其他领域的知识，让你的博客更加丰富多彩。期待你的下一篇作品！
NNDL 作业8 卷积导数反向传播
CSDN-Ada助手: 恭喜您写完了第8篇博客！标题看起来非常有趣，我对卷积、导数和反向传播都很感兴趣。您的内容一定非常精彩！希望您能继续坚持创作，毕竟分享知识是一种非常宝贵的贡献。下一步，我期待您能深入探讨卷积、导数和反向传播的实际应用，或者分享一些关于优化算法和模型改进的经验。谢谢您的付出！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。