凸优化——Lasso

最新推荐文章于 2024-06-26 22:52:23 发布

lyj2014211626

最新推荐文章于 2024-06-26 22:52:23 发布

阅读量6.4k

点赞数 2

分类专栏：科学理论

本文链接：https://blog.csdn.net/lyj2014211626/article/details/79133145

版权

LASSO是1996年Tibshirani提出的，是Least Absolute Shrinkage and Selection Operator，用于线性回归和逻辑回归，通过限制∑∥β∥1来实现变量选择。LASSO问题为凸优化问题，其解在样本数目大于特征数目且X满秩时是唯一的。相比之下，SVM虽然也是凸优化问题，但解不唯一。对于凸优化问题，局部最小值即是全局最小值，这是凸函数的特性。文章还探讨了凸优化的性质、技巧和分类。

摘要由CSDN通过智能技术生成

凸优化问题实例：LASSO

熟悉机器学习算法里面的线性回归或者逻辑回归的同学因该明白LASSO问题，其定义为：

min β \in R p s u b j e c t t o ∥ y - X β ∥ 22 ∥ β ∥ 1 \leq s

LASSO是Tibshirani（对就是Tibshirani）在1996年JRSSB上的一篇文章上《Regression shrinkage and selection via lasso》提出的。所谓lasso，其全称是least absolute shrinkage and selection operator，其含义是在限制了 ∑∥β∥1≤s 的情况下，求使得残差平和达到最小的参数的估值。Tibshirani指出，对于回归算法，当 s 足够小的时候，会使得某些回归系数的估值是0，可以起到变量选择的作用，是逐步回归的一种表现。

因此，对于LASSO算法，其是否是凸优化问题？它的解集合是否是唯一的点？

答案是，LASSO问题是凸优化问题，因为 f(x)=∥y−Xβ∥22 和 g(x)=∥β∥1−s 均是凸函数，因此该问题为凸优化问题；如果样本数目 n 大于特征数目 p ，且X满秩，那么 ∇2f(β)=2XTX⪰0 ，关于 β 二阶微分恒为半正定p.s.d.，因此，解是唯一的；但是，如果样本数目 n 小于特征数目 p ，那么会造成高维特征空间上的维数灾难问题，此时，X为奇异矩阵，则解不唯一。

另一个实例是SVM算法，SVM算法的理论部分我就不多介绍了，会在机器学习算法篇章中对SVM做着重介绍，如果我们记SVM为：

min β, β 0, ξ s u b j e c t t o 1 2 ∥ β ∥ 22 + C \sum i n ξ i ξ i \geq 0, i = 1, \dots, n y i (x T i β + β 0) \geq 1 - ξ i, i = 1, \dots, n

其中， 1∥β∥ 为下图两个虚线边界的距离， ξ 为引入分类错误的代价，代表下图错分样本点距正确分类边界的距离。具体如下图：

那么，该问题是否为凸优化问题呢？它的解是否是唯一？

答案是，SVM目标函数是凸优化问题，但是，它的解并不唯一，因为它不是严格凸函数。有兴趣的同学可以留言来解释为什么SVM是凸优化问题！

4. 局部最小值就是全局最小值

局部最优解的定义为：如果 ∃R>0 ，使得 f(x)

最低0.47元/天解锁文章

lyj2014211626

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
凸优化——Lasso

凸优化问题实例：LASSO熟悉机器学习算法里面的线性回归或者逻辑回归的同学因该明白LASSO问题，其定义为：minβ∈Rpsubjectto∥y−Xβ∥22∥β∥1≤sminβ∈Rp∥y−Xβ∥22subjectto∥β∥1≤sLASSO是Tibshirani（对就是Tibshirani）在1996年JRSSB上的一篇文章上《Regression shrinka
复制链接

扫一扫

专栏目录