Stanford Online-统计学习-ISLR-Ch3-Linear Regression

本文介绍了线性回归模型,包括损失函数、参数评估标准。重点阐述了如何利用标准误差评估参数,计算置信区间,进行假设检验以判断X和Y之间的关系强度,并通过R2值反映关联性。
摘要由CSDN通过智能技术生成

1. 线性模型

简单粗暴,直接上模型:

Y=β0+β1X+ϵ

这是对“世界上所有数据“的假想模型,即我们 假设“世界上所有数据“是从这个模型中产生的。虽然我们也不清楚这个假设对不对,但是就是这样假设了,看看结果好不好再决定对不对。

但是我们得不到“世界上所有的数据“,我们只有“训练数据集“,所以我们可以得到的模型是这样的:

Ŷ =β̂ 0+β̂ 1X+ϵ

“hat“表示这个变量是estimated的,不是real的,也就是说我们对上面的“假设“在进行了一次假设。效果好不好得看结果才知道,这里就这么粗暴地假设了。

2. 损失函数

模型中未知的是 β̂  ,将通过损失函数来得道。直接上损失函数,来评估这个estimated的模型的好坏,从而得到好的 β̂ 

定义“残差“ (residual): ei=yiyi^

定义“残差和“ (Residual Sum of Squares): RSS=e21+e22+...+e2n

我们的目的,让“残差和“最小。于是通过“求导等于0“来求解极小值点。因为只有 β̂  ,所以“求导等于0“可以把相应的 β̂  求解出来。

3. 参数“好坏“评估

下面用“统计学“中的方法来评估一下这个模型,看看参数对不对,好不好。

3.1 Standard Error

β0 β1 的 Standard Error 定义如下:

SE(β̂ 1)2=V
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值