什么是稀疏?
稀疏指的是消除数据中一些特征,用来使模型泛化,减小过拟合的几率
什么是正则化?
正则化(regularizer)指的是通过给需要训练的目标函数加上一些规则(限制),缩小求解的范围。
如何证明L1正则化会导致稀疏?
正则化的目的是,当系数w为0时,损失函数正好可以得到最优值(最小值)。
公式推导
从梯度的角度看
C = C 0 + λ ∑ ∣ w ∣ C=C_0+\lambda\sum\left|w\right| C=C0+λ∑∣w∣
C为带有正则项的损失函数。 C 0 C_0 C0