线性回归相关笔记 Linear Regression

目录

Module 3

3.1 Outliers 

定义:

两种类型:

3.2 Inference for linear regression

Slope的假设检验 hypotheses

假设检验用的系数是T statistic

Slope的置信区间 Confidence interval

3.3 Variability Partitioning

Analysis of Variance (ANOVA)

计算R^2的两种方法


  • Module 3

    • 3.1 Outliers 

      • 定义:

        • Points that fall away from the cloud of points
      • 两种类型:

        • Leverage points: 这种是水平远离大部分点,所以不太影响slope
        • influential points: 基本上都是在很高的地方,会影响斜率
    • 3.2 Inference for linear regression

      • Slope的假设检验 hypotheses

        • H_0: \beta_1=0 explanatory variable is not a significant predictor of response variable; no relationship; slope of the relationship is 0 (H0总是什么都不发生的情况)
        • H_A: \beta_1 \neq 0 与上面相反 (HA是发生了什么的情况)
      • 假设检验用的系数是T statistic

        • T = \frac{b_1-0}{SE_{b_1}}, df = n-2
          • 为什么df=n-2?因为估算了两个参数β0和β1,每估算一个就要减去1。
      • Slope的置信区间 Confidence interval

        • 置信区间的意义:

          • 以95%为例解释(0.7,1.1)
            • 我们有95%的把握,explanatory variable每增加1点,response variable会预计平均增加0.7到1.1点(expected on average to be higher)
        • Point estimate +- margin of error:b_1+t^*_{df}SE_{b_1}
        • 使用R求t*:我们求df=25时95%CI的t score,0.025是因为(1-0.95)/2
          • qt(0.025, df = 25)
    • 3.3 Variability Partitioning

      • Analysis of Variance (ANOVA)

      • 计算R^2的两种方法

        • 直接算R^2
        • SSreg / SStotal
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值