目录
权重衰退
是最广泛使用的正则化的技术之一。
使用均方范数作为硬性限制
通过限制参数值的选择范围来控制模型容量。
通常不限制偏移b(因为限制与不限制的差别不大)。
小的θ意味着更强的正则项。
使用均方范数作为柔性限制
对于每个θ,都可以找到λ使得之前的目标函数等价于下面
可以通过拉格朗日乘子来证明。
超参数λ控制了正则项的重要程度。
λ=0:无作用。
λ->是⚮,w*->0。
参数更新法则
- 计算梯度
目录
是最广泛使用的正则化的技术之一。
通过限制参数值的选择范围来控制模型容量。
通常不限制偏移b(因为限制与不限制的差别不大)。
小的θ意味着更强的正则项。
对于每个θ,都可以找到λ使得之前的目标函数等价于下面
可以通过拉格朗日乘子来证明。
超参数λ控制了正则项的重要程度。
λ=0:无作用。
λ->是⚮,w*->0。
参数更新法则