L1和L2正则化部分比较

最新推荐文章于 2024-07-11 09:21:08 发布

yMMxz

最新推荐文章于 2024-07-11 09:21:08 发布

阅读量1k

点赞数 2

分类专栏：机器学习

机器学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

L1和L2正则化：

比方说，有几个特征的共线性很高，并且它们对于分类都很重要，这时L1的做法是随机选择其中一个特征，而扔掉其它的特征。试想，如果训练数据中有很多这样类似的特征，那么经过L1正则化后的模型将会失去很多有用的特征，进而导致模型误差较大。这个时候，我们不得不选择L2正则化了，但由于L2正则化在面对大量无关特征并且特征不是由高斯分布产生时，误差依然很大，因此我们需要在训练模型之前，先进行特征选择，然后再用L2正则化，L2正则化的特点是，在面对几个存在共线性的特征时，它会将权值平分给这些特征，从而使得这些有用的特征都得以留下。

使用L1可以得到稀疏的权值；用L2可以得到平滑的权值。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

yMMxz CSDN认证博客专家 CSDN认证企业博客

码龄7年

9: 原创

44万+: 周排名

129万+: 总排名

3万+: 访问

: 等级

507: 积分

3: 粉丝

11: 获赞

4: 评论

19: 收藏

私信

关注

热门文章

分类专栏

最新评论

坐标轴下降法（解决L1正则化不可导的问题）
拉格朗日的微笑: 我觉得说清楚了呀，觉得没说清楚的同学应该是没弄懂坐标轴下降法吧。当然次梯度下降法也可以，但是计算量特别大，求解缓慢；另外还可以用Proximal Algorithm来迭代
坐标轴下降法（解决L1正则化不可导的问题）
qqmznsw: 这里介绍的坐标下降法并没有说明如何解决l1不可导问题，事实上解决l1不可导的一种方法是采用在不可导点采用次梯度代替梯度。
坐标轴下降法（解决L1正则化不可导的问题）
Z-Pilgrim: 你好请问为什么这种情况下就能解决L1不可导的问题了？求argmin J的时候不是还得求对参数的导数，还是绕不开对L1求导吧？
批量梯度下降算法BGD，小批量梯度下降法MBGD，随机梯度下降算法SGD的比较
村民的菜篮子: 请问我的训练数据集为16000张图片，若采用小批量梯度下降，那么这个批大小应该设置为多少合适呢？我在TensorFlow中也没找到小批量下降的函数，不知道TensorFlow有没有集成小批量梯度下降算法

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。