统计学:回归分析

文章目录0.概述1.用趋势线进行回归分析2.用回归函数进行回归分析3.用回归分析工具进行回归分析4.多元线性回归分析多元线性回归系数的求解多元线性回归的统计检验用回归函数进行多元回归用回归分析工具进行多元线性回归分析本文是《Excel统计分析与应用》第11章的阅读笔记,后续将会在此基础上进行知识应用拓展的补充。0.概述回归分析:通过最小二乘法拟合进行分析。侧重于考查一个或几个变量的变化...
摘要由CSDN通过智能技术生成

本文是《Excel统计分析与应用》第11章的阅读笔记,后续将会在此基础上进行知识应用拓展的补充。

0.概述

回归分析:

  • 通过最小二乘法拟合进行分析。
  • 侧重于考查一个或几个变量的变化对另一个变量的影响程度。
  • 应用:正交设计、均匀设计、配方设计、符合设计等试验需要通过回归分析来寻找变量间的关系。

1.用趋势线进行回归分析

在回归分析中,在散点图上添加趋势线可以得到一元线性回归分析的结果。

趋势线参数:

  • 斜率,反映两个变量之间关系的强弱,自变量每增加一个单位时,因变量的变化值。
  • 截距,表示自变量x=0时,因变量y的值。
  • 判定系数 R 2 R^2 R2,反映回归公式能够解释原数据的能力, R 2 R^2 R2越大,解释能力越强。

2.用回归函数进行回归分析

在Excel中,回归分析系数的计算:

  • 斜率,用SLOP函数计算。
  • 截距,用INTERCEPT函数计算。
  • 回归参数,用RSQ函数计算。

1.计算斜率
斜率的计算公式: b = n ∑ x y − ( ∑ x ) ( ∑ y ) n ∑ x 2 + ( ∑ x ) 2 b = \frac{n\sum{x}{y}-(\sum{x})(\sum{y})}{n\sum{x^2}+(\sum x)^2} b=nx2+(x)2nxy(x)(y)
SLOP函数表示:=SLOP(known_y’s,known_x’s)

  • known_y’s,表示自变量的数据集合;
  • known_x’s,表示因变量的数据集合;
  • 参数可以是数字、数组或引用;
  • 如果数组或引用参数包含文本、逻辑值或空白单元格时,这些值将会被忽略;
  • 如果known_y’s,known_x’s包含的数据个数不相等或不包含任何数据点时,函数将显示错误值。

2.计算截距
斜率的计算公式: a = Y ˉ − b X ˉ a = \bar Y - b\bar X a=YˉbXˉ
INTERCEPT函数表示:=INTERCEPT(known_y’s,known_x’s)

  • 参数值同SLOP函数的参数。

3.用回归分析函数的数组形式计算回归分析系数
可以用LINEST函数来实现。

LINEST函数,通过用最小二乘法计算与现有数据最佳拟合的直线,来计算直线的统计值,并返回描述此直线的截距和斜率数组。

LINEST函数表示:=LINEST(known_y’s,[known_x’s],[const],[stats])
参数:

  • []内为可选项,返回回归直线的截距和斜率。
  • known_y’s必须,表示自变量的数据集合。
  • known_x’s可选,表示因变量的数据集合。对应的单元格区域可以包含一组或多组变量。若只有一个变量,只要known_y’s和known_x’s有相同的维数,它们可以是任何形状的区域。若有多个变量,known_y’s必须为一行或一列的区域。若省略known_x’s,得到的数组大小与known_y’s相同。
  • const,表示一个逻辑值,取值为True或False,用于指定是否将截距设置为0。默认b不设为0。
  • stats,表示一个逻辑值,取值为True或False,用于指定是否返回附加回归统计值(标准误差、判定系数、F值等)。

4.计算回归参数
RSQ函数,用于返回线性回归模型给的判定系数,即根据known_y’s,known_x’s中的数据计算得出的Pearson乘积矩相关系数的平方。

RSQ函数表示:=RSQ(known_y’s,known_x’s)
参数:

  • 参数同SLOP函数的参数。

3.用回归分析工具进行回归分析

回归分析工具的分析结果包括:

  • SUMMARY OUTPUT(回归汇总输出),包括方差分析表、截距、斜率、判定系数、调整后判定系数、P值等统计信息。
  • RESIDUAL OUTPUT(残差输出),包括预测值、残差项、标准残差项及对应的残差图、线性拟合图等分析结果。
  • PROBABILITY OUTPUT(正态概率输出),包括正态分布概率及对应的正态分布概率图。

4.多元线性回归分析

多元线性回归系数的求解

多元线性回归,是一个因变量与两个及两个以上自变量的回归。

多元回归模型,描述因变量Y如何依赖自变量 X 1 i X_{1i} X1i,……, X m i X_{mi} Xmi和误差项 u i u_i ui 的方程。公式表示如下: y = β 0 + β 1 x 1 + β 2 x 2 + … … + β k x k + ϵ y = \beta_0+\beta_1x_1+\beta_2x_2+……+\beta_kx_k+\epsilon y=β0+β1x1+β2x2++βkxk+ϵ

  • β 0 \beta_0 β0,截距。
  • β 1 , β 2 , … … , β k \beta_1,\beta_2,……,\beta_k β1,β2,,βk,回归系数。
  • X 1 i , … … , X m i X_{1i},……,X_{mi} X1iXmi,解释变量,非随机变量。
  • ϵ \epsilon ϵ,随机扰动项。误差项 ϵ \epsilon ϵ是一个期望值为0的随机变量,对于自变量 X 1 i , … … , X m i X_{1i},……,X_{mi} X1iXmi的所有值, ϵ \epsilon ϵ的方差都相同,且 ϵ \epsilon ϵ服从正态分布,相互独立。

估计的多元回归方程:用样本统计量 β ^ 0 , β ^ 1 , β ^ 2 , . . . , β ^ k \hat \beta_0,\hat \beta_1,\hat \beta_2,...,\hat \beta_k β^

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值