Mxnet (7):过拟合处理之权重衰减(Weight Decay)

本文详细介绍了权重衰减,即L2正则化的概念及其在高维线性回归中的作用。通过模拟数据和训练模型,展示了权重衰减如何缓解过拟合,使模型在测试集上的性能得到提升,并提供了使用权重衰减的代码示例。
摘要由CSDN通过智能技术生成

1.权重衰减

面对过拟合问题,最有效的方法就是增加数据集的大小,但是增加数据往往是比较困难的,短期内很难实现,因为数据都是积累而来的。所以着重专注于应用正则化处理数据来实现减少过拟合。

1.1 规范 和 权重衰减

权重衰减等价于 L 2 L_2 L2 范数正则化(regularization)。则化通过为模型损失函数添加惩罚项使学出的模型参数值较小,是应对过拟合的常用手段。线性回归损失函数:
L ( w , b ) = 1 n ∑ i = 1 n 1 2 ( w ⊤ x ( i ) + b − y ( i ) ) 2 L(\mathbf{w}, b) = \frac{1}{n}\sum_{i=1}^n \frac{1}{2}\left(\mathbf{w}^\top \mathbf{x}^{(i)} + b - y^{(i)}\right)^2 L(w,b)=n1i=1n21(wx(i)+by(i))2
其中 w w w是权重参数, b b b 是偏差参数。带有 L 2 L_2 L2 范数惩罚项的新损失函数为:
L ( w , b ) + λ 2 ∥ w ∥ 2 L(\mathbf{w}, b) + \frac{\lambda}{2} \|\mathbf{w}\|^2 L(w,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值