DNN训练技巧

最新推荐文章于 2024-06-19 09:27:39 发布

ChristineC_

最新推荐文章于 2024-06-19 09:27:39 发布

阅读量724

点赞数 1

分类专栏： DNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ChristineC_/article/details/105635915

版权

权重约束通过限制权重大小防止过拟合，如单位范数、最大范数等。结合其他正则化手段能提升模型泛化能力。归一化策略如内部协变量转移，通过Batch、Layer、Weight或Cosine Normalization稳定训练过程，适应不同场景需求。

摘要由CSDN通过智能技术生成

Weight Constraint

在训练过程中，weight constraint（比如L2 norm，max norm）能保证学到的权重较小，和weight penalty效果等价。如果权重较大，则说明模型从异常值里学到了噪音，容易导致模型过拟合、不稳定。在loss中加入weight penalty，当weight很大时，会增加penalty，loss也就变大，但是，weight penalty不能保证权重一定很小，也有可能较大。而使用weight constraint，是在训练过程中，不断检查权重大小是否超过预先确定的一个阈值，如果超过，就rescale到阈值以下或者保持在一个范围之内。因此，weight constraint保证所有学到的权重都很小。

weight constraint和其他正则化方法（比如dropout）一起用，能明显提高模型的泛化性。

weight constraint的选择：

unit norm：vector norm = 1
maximum norm：限制vector norm的最大值
min-max norm：限制vector norm的最大值和最小值
non-nagative weights

使用weight constraint的小技巧：

输入数据归一化/标准化
learning rate可以设置得较大

Normalization

什么是Internal Covariate Shift?

深度神经网络涉及到多层的叠加，每一层的参数更新会

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
DNN训练技巧

Weight Constraint在训练过程中，weight constraint（比如L2 norm，max norm）能保证学到的权重较小，和weight penalty效果等价。如果权重较大，则说明模型从异常值里学到了噪音，容易导致模型过拟合、不稳定。在loss中加入weight penalty，当weight很大时，会增加penalty，loss也就变大，但是，weight penal...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。