LASSO问题及其最优解

最新推荐文章于 2023-07-16 22:26:40 发布

weixin_33946605

最新推荐文章于 2023-07-16 22:26:40 发布

阅读量1.9k

点赞数

原文链接：http://www.cnblogs.com/yi-ming/p/4080146.html

版权

本文探讨了LASSO（Least Absolute Shrinkage and Selection Operator）问题，解释了LASSO如何通过引入ℓ1正则化产生稀疏解，解决了高维数据中的overfitting问题。在正交设计情况下，分析了LASSO最优解的性质，并通过与ridge regression对比，展示了LASSO的软阈值特性，从而提供了稀疏解的直观理解。

摘要由CSDN通过智能技术生成

转载，原文地址：http://blog.csdn.net/xidianzhimeng/article/details/20856047

Sparsity 是当今机器学习领域中的一个重要话题。John Lafferty 和 Larry Wasserman 在 2006 年的一篇评论中提到：

Some current challenges … are high dimensional data, sparsity, semi-supervised learning, the relation between computation and risk, and structured prediction.John Lafferty and Larry Wasserman. Challenges in statistical machine learning. Statistica Sinica. Volume 16, Number 2, pp. 307-323, 2006.

Sparsity 的最重要的客户大概要属 high dimensional data 了吧。现在的机器学习问题中，具有非常高维度的数据随处可见。例如，在文档或图片分类中常用的 bag of words 模型里，如果词典的大小是一百万，那么每个文档将由一百万维的向量来表示。高维度带来的的一个问题就是计算量：在一百万维的空间中，即使计算向量的内积这样的基本操作也会是非常费力的。不过，如果向量是稀疏的的话（事实上在 bag of words 模型中文档向量通常都是非常稀疏的），例如两个向量分别只有