3.L1和L2的区别；L1为什么能稀疏矩阵L2不能；L2为什么能解决过拟合

haidixipan

于 2018-10-19 19:36:41 发布

阅读量1.9k

点赞数

分类专栏：技术面试文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haidixipan/article/details/83186850

版权

技术面试专栏收录该内容

57 篇文章 1 订阅

订阅专栏

1.L1和L2的区别

L1:预测值与实际值差值的绝对值之和

L2:预测值与实际值差值的平方之和

2.L1为什么能稀疏矩阵L2不能:

参考链接：https://blog.csdn.net/autocyz/article/details/76511527，

矩阵指的是模型参数组成的矩阵，稀疏是指模型参数很多是0。

为什么L1可以呢，从一个特征的模型来观察，损失函数为 F(w)=f+ b|w| ,对于参数w，增加后一项相对于引入了w的拉普拉斯先验，从拉普拉斯先验的函数可看出，w分布集中在0点附近，因此引入拉普拉斯先验后w为0值变多。L2相当于引入了高斯变换，可看出高斯变换平缓，因此不会出现0点聚集的情况

3.L2为什么能解决过拟合

参考：https://blog.csdn.net/jackie_zhu/article/details/5213459

过拟合通常是因为特征系数过大导致，因此为了防止过拟合，可以对系数加一定的限制，L2就是相当于让系数的平方小于常数C，熟悉拉格朗日乘数法的可知道，这种有约束的最优化问题可以转换为求“最优化目标函数+约束函数的导数为0”的问题。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
3.L1和L2的区别；L1为什么能稀疏矩阵L2不能；L2为什么能解决过拟合

1.L1和L2的区别L1:预测值与实际值差值的绝对值之和L2:预测值与实际值差值的平方之和 2.L1为什么能稀疏矩阵L2不能:参考链接：https://blog.csdn.net/autocyz/article/details/76511527，矩阵指的是模型参数组成的矩阵，稀疏是指模型参数很多是0。为什么L1可以呢，从一个特征的模型来观察，损失函数为 F(w)=f+ ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。