数据挖掘学习--LASSO降维

本文介绍了LASSO正则化在处理高维数据时的作用,作为解决维灾难和过拟合的手段。LASSO正则化通过在损失函数中引入惩罚项,限制权重向量的大小,且能产生稀疏性,实现特征选择。与岭回归相比,LASSO正则化在目标向量中允许出现0值,有助于降低模型复杂度。
摘要由CSDN通过智能技术生成

1.前言

今天碰到了多项式回归以及正则化降维的知识点,还没有全部搞懂,略微写写现在自己的理解,理解有错误多多包涵。

2.背景

再我们的实际处理数据中,我们会碰到很多高维的数据。这些高维的数据意思就是样本基数n要远小于数据维度p。这种情况就会叫做维灾难。维灾难也会很容易导致另一个我们机器学习里面很严重的一个问题----overfitting。要想解决维灾难,无非就是解决n << p的问题。要么就增大n(提高样本容量),要么就减少p(降维)。第一种方法并不是我们主观能决定的,实际中没有那么容易实现,那么就是选择去,降维。
先前就有学习降维的方法----主成分分析。但是这种方法是将所有的数据都做了变动,考虑到我只想去除某些我不需要的特征属性,保留原有的特征属性,那么就采用另外一种降维方法----LASSO正则化。

3.理论知识

对比LinearRegression,他的损失函数就是
在这里插入图片描述
这样会出现一个问题,就是像在多项式回归时所讲,我们这样得到的向量w有可能数值很大,通过实验我们不难发现这就是出现了overfitting的情况了。怎么解决这个问题呢,也就说怎么避免向量w出现很大的数字的情况呢。做法就是,加入一个惩罚项(penalty item),如下图所示:

  • 3
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值