性线回归的变量选择——传统方法 VS Lasso

最新推荐文章于 2022-07-15 11:05:38 发布

Angel Q.

最新推荐文章于 2022-07-15 11:05:38 发布

阅读量2.3k

点赞数

分类专栏：线性回归文章标签：统计模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_57082933/article/details/117265619

版权

线性回归专栏收录该内容

8 篇文章 0 订阅

订阅专栏

前言：

1.线性回归需满足以下四个条件——线性、独立、正态、齐性。
（1）自变量与因变量之间存在线性关系：这可以通过绘图观察。如果因变量Yi 与某个自变量X i 之间呈现出曲线趋势，可尝试通过变量变换予以修正，常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。
（2）各观测间相互独立：任意两个观测残差的协方差为0 ，也就是要求自变量间不存在多重共线性问题。如果存在多重共线可能就需要用到脊回归（Ridge）和弹性网（Elastic Net）
（3）残差e 服从正态分布N(0,σ2) ：其方差σ2 = var (ei) 反映了回归模型的精度， σ 越小，用所得到回归模型预测y的精确度愈高。
（4） e 的大小不随所有变量取值水平的改变而改变，即方差齐性。

2.介绍模型常用的四个性能指标——R平方、AIC、BIC、Cp

（1）R平方：它是预测变量能解释结果变量变异的百分比例，范围是【0，1】。R平方越高，模型越好。

（2）AIC：基本思想是对模型中包含额外变量的行为进行惩罚。每当增加一个新变量时，它将增加一个惩罚值，从而达到控制额外预测变量的结果。AIC越低，模型越好。

（3）BIC：是AIC的一种变体，利用了贝叶斯原理，当模型中增加新的变量时，它将受到比AIC更大的惩罚。自然，BIC越低，模型越好。

（4）Cp：也是AIC的一种变体，Cp越低，模型越好。

一、传统变量选择的四种方法:

（1）全子集回归：即考虑所有变量的不同组合。可想而知，变量一多，计算量very huge。

（2）向前选择法：从第一个最优的变量开始（个人认为就是最能影响被解释变量的那个变量），逐个选入，不断进行新模型的检验，直到模型精度不再显著增加。

（3）向后选择法：先将变量全部选入，逐个丢掉，不断进行新模型的检验，直到模型精度不再显著增加。

（4）both：是（2）和（3）的结合

二、非传统：Lasso回归

在的条件下（KKT条件），最小化残差平方和

利用拉格朗日法求解（可以采用交叉验证法求λ），即

可以使某些变量的系数变为0，从而达到变量选择的目的。

带了约束条件就是到原点的距离比最小二乘要小，就是压缩的。

三、二者比较：

传统方法要么计算量太大，要么可能无法获得绝对最佳的组合。
LASSO提供了正则化和有效的子集选择，即使您的参数多于观察值，也可以使用。

(以上内容均为本人课堂笔记整理，如有错误还请批评指正)

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
性线回归的变量选择——传统方法 VS Lasso

每天进步一点点——Lasso
复制链接

扫一扫

专栏目录

Angel Q. CSDN认证博客专家 CSDN认证企业博客

码龄3年

25: 原创

42万+: 周排名

6万+: 总排名

4万+: 访问

: 等级

308: 积分

35: 粉丝

50: 获赞

4: 评论

251: 收藏

私信

关注

热门文章

分类专栏

深度相机 1篇
点云 1篇
open3d 1篇
笔记 1篇
交叉验证 1篇
重抽样 1篇
分类 5篇
机器学习 3篇
回归分析 4篇
文本分析 1篇
线性回归 8篇
Box-Cox 1篇
方差分析 3篇
对应分析 1篇
典型相关分析 1篇

最新评论

实例：爬取豆瓣评论、绘制词云图以及情感分析——以《长津湖》为例
2301_81053683: 你好有表格有嘛，能发一下嘛，这边可以有偿
用深度相机k4arecorder扫出图片后的Open3D小demo
CSDN-Ada助手: 恭喜您写下了第20篇博客！标题看起来很有趣，我期待着阅读您的新作品。您在深度相机k4arecorder上的实践和Open3D的应用似乎非常值得期待。不过，我想提醒您，如果可能的话，可以考虑在接下来的创作中分享一些具体的案例或技术细节，这将更有助于读者理解和学习。再次恭喜您的连续创作，期待您的下一篇博客！
实例：爬取豆瓣评论、绘制词云图以及情感分析——以《长津湖》为例
m0_65289423: 您好我想问一下这个 data = pandas.read_excel( "C:\\Users\\Lenovo\\Documents\\comments.xlsx" ) 这个comment.xlsx在哪里下载
线性回归（ridge、lasso）
技术小白白~: 讲解很全面呀，大佬也在研究这块吗？平时可以多多交流
方差分析表和回归分析表的那些浆糊糊
m0_65651434: 我一直以为是我自己记得不清楚，改来改去，今天受不了了，两本书一起看逐字对比，不一样！我还以为什么垃圾书印错了？但是发现！！！！！！！计量中说是E是explained，回归中E是error 计量中R是residual，回归中是Regression 小丑竟是我自己科学家们记性可真好

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。