回归里的变量选择

最新推荐文章于 2022-08-10 18:55:38 发布

Angel Q.

最新推荐文章于 2022-08-10 18:55:38 发布

阅读量829

点赞数

分类专栏：回归分析方差分析线性回归文章标签：统计学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_57082933/article/details/120833741

版权

线性回归同时被 3 个专栏收录

8 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

为什么做变量选择：
首先是内存开销问题：以前由于数据不够庞大，此问题不明显。现在的一些数据特别的基因数据已经足够庞大到计算机无法一次读取，所以有了分布式等方法。做变量选择也是解决此问题的一个方法。
其次是奥卡姆剃刀法则，我们当然会选择最经济的模型来解决问题。
F start 统计量 (C 表示简单模型 A表示扩展模型 P表示参数) ：
分子为：SSE© - SSE(A) / P(A) - P© 表示的是增加的参数平均使SSE减少了多少或者说增加的参数平均解释了多少。
分母为：SSE(A) / n - P(A) 表示的是能放但没放进模型的参数平均能解释多少。
若F start 很大，则说明挑的参数很好，相当于拿超级英雄与普通人比较。
F统计量是F start 的特例，F是与零模型进行比较，而F start 是扩展模型与简约模型进行比较，即是在复杂模型中施加了惩罚（R square 是没有施加惩罚的），与方差-偏差权衡很像。
forward and backward选择过程：以三个变量为例
（注：forward可以用于p>n的情况）
forward：先对三个变量分别做，根据SSE选出最好的模型，再选入第二个变量（此时有两种可能），根据F start 选出最好的；最后再选入第三个变量，根据 F start 选出最优。
backward：先做全回归，在分别删掉一个变量，比较F start，直到F start 很大的时候停止。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
回归里的变量选择

每天进步一点点——变量选择＆Fstart
复制链接

扫一扫

专栏目录

Angel Q. CSDN认证博客专家 CSDN认证企业博客

码龄3年

23: 原创

74万+: 周排名

14万+: 总排名

4万+: 访问

: 等级

284: 积分

27: 粉丝

46: 获赞

4: 评论

244: 收藏

私信

关注

热门文章

分类专栏

深度相机 1篇
点云 1篇
open3d 1篇
笔记 1篇
交叉验证 1篇
重抽样 1篇
分类 5篇
机器学习 3篇
回归分析 4篇
文本分析 1篇
线性回归 8篇
Box-Cox 1篇
方差分析 3篇
对应分析 1篇
典型相关分析 1篇

最新评论

实例：爬取豆瓣评论、绘制词云图以及情感分析——以《长津湖》为例
2301_81053683: 你好有表格有嘛，能发一下嘛，这边可以有偿
用深度相机k4arecorder扫出图片后的Open3D小demo
CSDN-Ada助手: 恭喜您写下了第20篇博客！标题看起来很有趣，我期待着阅读您的新作品。您在深度相机k4arecorder上的实践和Open3D的应用似乎非常值得期待。不过，我想提醒您，如果可能的话，可以考虑在接下来的创作中分享一些具体的案例或技术细节，这将更有助于读者理解和学习。再次恭喜您的连续创作，期待您的下一篇博客！
实例：爬取豆瓣评论、绘制词云图以及情感分析——以《长津湖》为例
m0_65289423: 您好我想问一下这个 data = pandas.read_excel( "C:\\Users\\Lenovo\\Documents\\comments.xlsx" ) 这个comment.xlsx在哪里下载
线性回归（ridge、lasso）
技术小白白~: 讲解很全面呀，大佬也在研究这块吗？平时可以多多交流
方差分析表和回归分析表的那些浆糊糊
m0_65651434: 我一直以为是我自己记得不清楚，改来改去，今天受不了了，两本书一起看逐字对比，不一样！我还以为什么垃圾书印错了？但是发现！！！！！！！计量中说是E是explained，回归中E是error 计量中R是residual，回归中是Regression 小丑竟是我自己科学家们记性可真好

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。