Stanford Online-统计学习-ISLR-Ch3-Linear Regression

最新推荐文章于 2020-09-01 16:34:42 发布

LVB10101111

最新推荐文章于 2020-09-01 16:34:42 发布

阅读量657

点赞数

分类专栏：统计学习基础(ELS) 文章标签：统计学机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013515273/article/details/78523079

版权

本文介绍了线性回归模型，包括损失函数、参数评估标准。重点阐述了如何利用标准误差评估参数，计算置信区间，进行假设检验以判断X和Y之间的关系强度，并通过R2值反映关联性。

摘要由CSDN通过智能技术生成

1. 线性模型

简单粗暴，直接上模型：

Y = β 0 + β 1 X + ϵ

$Y = \beta_0 + \beta_1X + \epsilon$
这是对“世界上所有数据“的假想模型，即我们假设“世界上所有数据“是从这个模型中产生的。虽然我们也不清楚这个假设对不对，但是就是这样假设了，看看结果好不好再决定对不对。

但是我们得不到“世界上所有的数据“，我们只有“训练数据集“，所以我们可以得到的模型是这样的：

Y ̂ = β ̂ 0 + β ̂ 1 X + ϵ

$\hat{Y} = \hat{\beta}_0 + \hat{\beta}_1X + \epsilon$
“hat“表示这个变量是estimated的，不是real的，也就是说我们对上面的“假设“在进行了一次假设。效果好不好得看结果才知道，这里就这么粗暴地假设了。

2. 损失函数

模型中未知的是 $\hat{\beta}$ ，将通过损失函数来得道。直接上损失函数，来评估这个estimated的模型的好坏，从而得到好的 $\hat{\beta}$ 。

定义“残差“ (residual)： $e_i = y_i - \hat{y_i}$

定义“残差和“ (Residual Sum of Squares)： $RSS = e^2_1 + e^2_2 + ... + e^2_n$

我们的目的，让“残差和“最小。于是通过“求导等于0“来求解极小值点。因为只有 $\hat{\beta}$ ，所以“求导等于0“可以把相应的 $\hat{\beta}$ 求解出来。

3. 参数“好坏“评估

下面用“统计学“中的方法来评估一下这个模型，看看参数对不对，好不好。

3.1 Standard Error

$\beta_0$ 和 $\beta_1$ 的 Standard Error 定义如下：

S E (β ̂ 1) 2 = V

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。