Regularization

本文介绍了正则化的概念,特别是L1和L2正则化在机器学习中的区别和作用。L1正则化对应拉普拉斯分布,倾向于产生稀疏解,适用于特征选择;L2正则化对应高斯分布,使解靠近0。在L1和L2的结合中,Elastic Net解决了特征高相关性问题,通过权重平衡稀疏性和接近0的解。
摘要由CSDN通过智能技术生成

概述

L1和L2正则项本质上是对参数进行先验分布假设,具体来说L1对应拉普拉斯先验,L2对应高斯先验。
在这里插入图片描述

ML与MAP的不同

maximum likelihood (ML) 极大似然估计:
在这里插入图片描述

MAP (maximum a posterior) 最大后验概率估计:
在这里插入图片描述

p ( θ ) p(\theta) p(θ)进行了先验假设。

拉普拉斯分布

L1正则化对应假设每个参数服从均值为0的拉普拉斯分布。
在这里插入图片描述

b越小,越陡。

在这里插入图片描述

L1和L2不同

L1更倾向于获得稀疏解,因此还可以用于特征选择
L2更倾向于解在0附近

理由:
从先验概率分布角度解释:
由上面的拉普拉斯分布图可以看出,拉普拉斯分布是尖尖的分布,而高斯分布较平缓。因此拉普拉斯分布比高斯分布更集中在0这个点上。
从梯度角度考虑
L1给予了更大的下降力度,从而更快收敛到稀疏点。

扩展

线性回归问题中,加上 L 1 L_1 <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值