数据挖掘学习--LASSO降维

最新推荐文章于 2024-03-27 20:19:13 发布

努力奋斗的小白

最新推荐文章于 2024-03-27 20:19:13 发布

阅读量8.4k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37860003/article/details/97619901

版权

本文介绍了LASSO正则化在处理高维数据时的作用，作为解决维灾难和过拟合的手段。LASSO正则化通过在损失函数中引入惩罚项，限制权重向量的大小，且能产生稀疏性，实现特征选择。与岭回归相比，LASSO正则化在目标向量中允许出现0值，有助于降低模型复杂度。

摘要由CSDN通过智能技术生成

1.前言

今天碰到了多项式回归以及正则化降维的知识点，还没有全部搞懂，略微写写现在自己的理解，理解有错误多多包涵。

2.背景

再我们的实际处理数据中，我们会碰到很多高维的数据。这些高维的数据意思就是样本基数n要远小于数据维度p。这种情况就会叫做维灾难。维灾难也会很容易导致另一个我们机器学习里面很严重的一个问题----overfitting。要想解决维灾难，无非就是解决n << p的问题。要么就增大n（提高样本容量），要么就减少p（降维）。第一种方法并不是我们主观能决定的，实际中没有那么容易实现，那么就是选择去，降维。
先前就有学习降维的方法----主成分分析。但是这种方法是将所有的数据都做了变动，考虑到我只想去除某些我不需要的特征属性，保留原有的特征属性，那么就采用另外一种降维方法----LASSO正则化。

3.理论知识

对比LinearRegression，他的损失函数就是
在这里插入图片描述
这样会出现一个问题，就是像在多项式回归时所讲，我们这样得到的向量w有可能数值很大，通过实验我们不难发现这就是出现了overfitting的情况了。怎么解决这个问题呢，也就说怎么避免向量w出现很大的数字的情况呢。做法就是，加入一个惩罚项（penalty item），如下图所示：

最低0.47元/天解锁文章

努力奋斗的小白

关注

3
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘学习--LASSO降维

1.前言今天碰到了多项式回归以及正则化降维的知识点，还没有全部搞懂，略微写写现在自己的理解，理解有错误多多包涵。2.背景再我们的实际处理数据中，我们会碰到很多高维的数据。这些高维的数据意思就是样本基数n要远小于数据维度p。这种情况就会叫做维灾难。维灾难也会很容易导致另一个我们机器学习里面很严重的一个问题----overfitting。要想解决维灾难，无非就是解决n << p的问题...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。