方差分析与回归分析

最新推荐文章于 2022-09-14 16:22:30 发布

林同学在码代码

最新推荐文章于 2022-09-14 16:22:30 发布

阅读量1.7k

点赞数 1

分类专栏：概率论与数理统计

本文链接：https://blog.csdn.net/qq_44690631/article/details/107371513

版权

概率论与数理统计专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章目录

单因素方差分析
多因素方差分析
- 没有交互作用的双因素方差分析
- 有交互作用的双因素方差分析
相关系数
一元线性回归
回归诊断

单因素方差分析

方差分析就是要比较因素A的r个水平下试验指标理论均值的差异
$H_0:μ_1=μ_2=...=μ_r, H_1: μ_1,μ_2,...,μ_r不全相等$
总离差平方和(整体差异)
$SS_T=\sum_{i=1}^r\sum_{j=1}^{n_i}(X_{ij}-\bar X)^2$
效应平方和（由于因素A引起的差异）
$SS_A=\sum_{i=1}^rn_i(\bar X_{i\cdot}-\bar X)^2$
误差平方和（由随机误差所引起的差异）
$SS_E=\sum_{i=1}^r\sum_{j=1}^{n_i}( X_{ij}-\bar X_{i\cdot})^2$
平方和分解公式：
$SS_T=SS_E+SS_A$
定理
(i) $\frac{SS_E}{\sigma ^2} \sim\chi^2(n-r)$
即误差平方和除以方差（指的是随机误差的方差）的平方服从卡方分布
(ii) 误差平方和和效应平方和相互独立
(iii) 效应平方和的期望为 $E(SS_A)=(r-1)σ^2+\sum_{i=1}^rn_i\alpha_i^2$ 进一步有 $\frac{SS_A}{\sigma ^2} \sim\chi^2(r-1)$ 在r个水平下的均值相同条件下，有 $F=\frac{MS_A}{MS_E}\sim F(r-1,n-r)$ 其中 $MS_A=\frac{SS_A}{r-1},MS_E=\frac{SS_E}{n-r}$
根据以上定理，可以通过 $F$ 检验来进行方差分析，如果F值比较大的话（落在了{ $F\ge C$ }的区间内），那么判定均值存在差异。
如果 $F$ 检验是拒绝原假设，那么就要一一检验各均值是否存在差异，即多重比较。（可以通过两个正态总体均值t检验来获得结果）
$t_{ij} = \frac{\bar X_{i\cdot} - \bar X_{j\cdot}}{\sqrt{MS_E(\frac{1}{n_i}+\frac{1}{n_j})}} \sim t(n-r)$
可以看到，方差用了全部数据 $MS_E$ 来估计
方差分析的前提
(i) 独立性：各个水平下的总体都是简单随机样本
(ii) 正态性：各个水平下的总体均为正态总体
(iii) 方差齐性：各个水平下的总体方差是相同的
如何检验方差齐性？每组样本都有一个样本标准差，最大样本标准差不超过最小样本标准差的两倍

多因素方差分析

没有交互作用的双因素方差分析

主要任务是系统分析因素A和因素B对试验指标的影响
$H_{01}:\alpha_1=\alpha_2=...=\alpha_r=0, H_{11}: \alpha_1,\alpha_2,...,\alpha_r不全为零$
$H_{02}:\beta_1=\beta_2=...=\beta_s=0, H_{12}: \beta_1,\beta_2,...,\beta_s不全为零$
方差和分解公式：
$SS_T=SS_A+SS_B+SS_E$
其中 $SS_E=\sum_{i=1}^{r}\sum_{j=1}^{s}(X_{ij}-\bar X_{i\cdot}-\bar X_{\cdot j}+\bar X)^2$
可以证明在原假设成立的情况下
$F_A=MS_A/MS_E\sim F(r-1,(r-1)(s-1))$
$F_B=MS_B/MS_E\sim F(s-1,(r-1)(s-1)))$
进行 $F$ 检验即可

有交互作用的双因素方差分析

因素A有r个水平，因素B有s个水平，在每个因素的各个不同水平下均进行了重复t次试验。（在没有交互作用的双因素方差分析下t=1）
方差和分解公式：
$SS_T=SS_A+SS_B+SS_{AB}+SS_E$
其中
$SS_{AB}=t\sum_{i=1}^{r}\sum_{j=1}^{s}(\bar X_{ij\cdot}-\bar X_{i\cdot \cdot}-\bar X_{\cdot j\cdot}+\bar X)^2$
可以证明在原假设成立的情况下
$F_A=MS_A/MS_E\sim F(r-1,rs(t-1))$
$F_B=MS_B/MS_E\sim F(s-1,rs(t-1))$
$F_{AB}=MS_{AB}/MS_E\sim F((r-1)(s-1),rs(t-1))$
进行 $F$ 检验即可

一元线性回归

y关于x的回归函数为
$E(y|x)=\beta_0+\beta_1x$
这说明得到的y关于x的一元线性回归方程 $\hat y=\hat {\beta_0}+\hat{\beta_1}x$ 中的 $\hat y$ 是y的期望的估计，它在平均意义下表示了y随x变化的统计规律性

参数估计及参数的性质

有很多方法可以对模型参数进行估计，这里只介绍最小二乘法（采用极大似然估计也可以给出模型的参数估计）
最小二乘法的想法是最小化
$Q(\beta_0,\beta_1) = \sum_{i=1}^{n}(y_i-\beta_0-\beta_1x_i)^2$
利用微积分求极值的方法，求偏导为零记得到 $\hat \beta_0$ 和 $\hat \beta_1$

所得到的估计的 $\hat \beta_0$ 和 $\hat \beta_1$ 有一些性质：
(1) $\hat \beta_1 \sim N(β_1,\sigma^2/s_{xx})$
(2) $\hat \beta_0 \sim N(\beta_0,(\frac{1}{n}+\frac{\bar x^2}{s_{xx}})\sigma^2)$

可以看到还剩 $\sigma$ 的估计，我们用 $s^2$ 来估计 $\sigma^2$
$s^2=\frac{1}{n-2}\sum_{i=1}^{n}(y_i-\hat y_i)^2$

回归方程的显著性检验

如果 $\beta_1=0$ ，那么说明 $E (y)$ 不随 $x$ 变化，那么就没有线性关系。
$H_0:\beta_1=0, H_1:\beta_1 \neq 0$
常用的检验方法有两种：
(1) t检验法：
$T=\frac{\hat \beta_1\sqrt{s_{xx}}}{s} \sim t(n-2)$
(2) F检验法：
$F=\frac{\hat \beta_1^2s_{xx}}{s^2} \sim F(1,n-2)$
用以进行 $\beta_1$ 的假设检验

回归系数的区间估计

枢轴量
$T=\frac{\hat \beta_1-\beta_1}{s/\sqrt {s_{xx}}}\sim t(n-2)$

预测

(1) $E(y_0)$ 的区间估计
$\hat {y_0} \sim N(\beta_0+\beta_1x_0,(\frac{1}{n}+\frac{(x_0-\bar x)^2}{s_{xx}})\sigma^2)$
则
$T=\frac{\hat{y_0}-E(y_0)}{s\sqrt{\frac{1}{n}+\frac{(x_0-\bar x)^2}{s_{xx}}}}\sim t(n-2)$
可得出 $E(y_0)$ 的置信区间

(2) $y_0$ 的预测区间
$T=\frac{\hat{y_0}-y_0}{s\sqrt{1+\frac{1}{n}+\frac{(x_0-\bar x)^2}{s_{xx}}}}\sim t(n-2)$
可得出 $y_0$ 的置信区间

回归诊断

因为回归有一定假设，接下来我们就要检验这些假设是否成立

模型线性假设的诊断

(1) 可以从变量之间的散点图看大致是否呈线性关系
(2) 可以从残差图发现大致是否呈线性关系，如果发现点的散布无规律，则说明线性假设是合适的

随机误差方差齐性的诊断

(1) 可以观察残差图，判断残差的方差是否随着 $x$ 的变化而变化
(2) 如果存在变化，需要对 $y$ 进行变化（取对数、取指数等等）

随机误差独立性地诊断

(1) 可以观察残差图，如果残差的符号改变非常频繁，或者残差图中残差符号出现“集团”的趋势，这说明独立性是不合适的
(2) 如果发现独立性假设不成立，需要修改模型，常用的方法是差分法

随机误差的正态性的诊断

(1) 采用卡方检验对残差进行正态性检验
(2) 如果发现不满足正态性，可以做Box-Cox变换

林同学在码代码

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
方差分析与回归分析

文章目录单因素方差分析多因素方差分析没有交互作用的双因素方差分析有交互作用的双因素方差分析相关系数一元线性回归参数估计及参数的性质回归方程的显著性检验回归系数的区间估计预测回归诊断模型线性假设的诊断随机误差方差齐性的诊断随机误差独立性地诊断随机误差的正态性的诊断单因素方差分析方差分析就是要比较因素A的r个水平下试验指标理论均值的差异H0:μ1=μ2=...=μr,H1:μ1,μ2,...,μr不全相等H_0:μ_1=μ_2=...=μ_r, H_1: μ_1,μ_2,...,μ_r不全相等H0:μ
复制链接

扫一扫