1.正则化
正则化是用来防止模型过拟合而采取的手段。我们对Loss函数增加一个限制条件,限制其较高次的参数大小不能过大。如回归模型:
正是那些高次项导致了过拟合的产生,所以如果我们能让这些高次项的系数接近于0的话,我们就能很好的拟合了,因此,我们对代价函数进行修改如下:
我们在方程中增加了两个限制条件,分别对和
进行限制,不能让他们过高。很直观的看出,要想使
最小化,不仅仅需要
足够拟合
,同时还需要减少
和
损失函数后面会添加一个额外项,常用的额外项一般有两种,称作 L1正则化和L2正则化,或者L1范数和L2范数,是为了限制模型的参数,防止模型过拟合而加在损失函数后面的一项。
区别:
L1是模型各个参数的绝对值之和。
L2是模型各个参数的平方和的开方值。
1.1 L1正则化