前言
接触正则化是在《动手学习深度学习》的weight_decay中
权重衰退是通过L2正则化限制模型的参数,从而控制模型的复杂度
引用:
一、正则化是什么
通常在损失函数后面我们经常会看到有一个额外项,l1-normal L2-noraml
我们称他们为L1正则化/L2正则化,也可以说是L1范数,L2范数
将他们称之为损失函数的惩罚项(penalty)
二、L1 L2正则化说明
L1正则化是指权值向量w ww中各个元素的绝对值之和,通常表示为||W||1
L2正则化是指权值向量w ww中各个元素的平方和然后再求平方根(可以看到Ridge回归的L2正则化项有平方符号),通常表示为 ||w||^2