模型选择——子集选择法（Subset Selection)

最新推荐文章于 2023-06-11 17:43:45 发布

elsie77

最新推荐文章于 2023-06-11 17:43:45 发布

阅读量7.9k

点赞数 9

分类专栏： Business Statistics 文章标签：机器学习深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_48988106/article/details/120790531

版权

文章目录

一、前言

模型选择方法有三种，分别是：子集选择法（subset selection), 收缩法（Shrinkage）和降维法（Dimension Reduction）。

这篇文章主要介绍模型选择的子集选择法。
$\$

二、为什么要进行模型选择？

对于线性模型：
$\beta_{0} + \beta_{1}X_{1}+...+ \beta_{p}X_{p} +\epsilon$
模型选择就是要：决定P的大小；确定哪些特征是重要的。

而进行模型选择，主要出于预测准确性（Prediction Accuracy）和模型解释度（Model Interpretability)两方面考虑。

模型准确性：当p > n时，最小二乘法失效，此时需要模型选择来控制方差，使模型成功拟合。
模型解释性：因为多元回归模型中的一些自变量可能与因变量无关，但最小二乘法得到的无关变量的系数可能不为0，此时需要通过模型选择移除某些无关特征。

$\$

三、模型选择标准

对于训练集来说，包含了所有变量的模型总是有着最小的RSS和最大的 $R^2$ ，所以RSS和 $R^2$ 不适合用来作为模型选择的标准。

通常情况下，我们希望选择拥有最小测试误差（Test error)的模型。那么我们该如何知道测试误差呢？

通过训练误差调整得到测试误差: Adjusted $R^2$ , Mallow’s C_p, AIC, BIC
直接预测测试误差: 校验集方法（Validation Set Approach）, 交叉验证（Cross-validation）

1. 调整得到Test error

1.1 调整后的 $R^2$ (Adjusted $R^2$ )

最低0.47元/天解锁文章

关注

9
点赞
踩
36

收藏

觉得还不错? 一键收藏
1
评论
模型选择——子集选择法（Subset Selection)

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。