171121 Differences between the L1-norm and the L2-norm

最新推荐文章于 2022-10-09 00:52:47 发布

GuokLiu

最新推荐文章于 2022-10-09 00:52:47 发布

阅读量506

点赞数

分类专栏： Pre-Knowledges

本文链接：https://blog.csdn.net/qq_33039859/article/details/78593578

版权

42 篇文章 1 订阅

订阅专栏

As an error function

train for parameters

L 1 - n o r m : S = \sum i = 1 n | y i - f (x i) |

$L1-norm: \quad S = \sum^n_{i=1}|y_i-f(x_i)|$

L 2 - n o r m : S = \sum i = 1 n (y i - f (x i)) 2

$L2-norm:\quad S = \sum^n_{i=1}(y_i-f(x_i))^2$

prevent overfitting

L 1 - r e g u l a r i z a t i o n : w * = a r g m i n w \sum j (t (x j) - \sum i w i h i (x j)) 2 + λ \sum i = 1 k | w i |

$L1-regularization: \quad w^* = arg\quad \underset{w}{min}\sum_j(t(x_j)-\sum_iw_ih_i(x_j))^2+\lambda\sum^k_{i=1}|w_i|$

L 2 - r e g u l a r i z a t i o n : w * = a r g m i n w \sum j (t (x j) - \sum i w i h i (x j)) 2 + λ \sum i = 1 k w 2 i

$L2-regularization:w^* = arg\quad \underset{w}{min}\sum_j(t(x_j)-\sum_iw_ih_i(x_j))^2+\lambda\sum^k_{i=1}w_i^2$

L2 regularization	L1 regularization
Computational efficient due to having analytical solutions	Computational inefficient on non-saprse cases
Non-saprse outputs	Sparse outputs
No feature selection	Built-in feature selection

关注