【统计知识总结系列01】回归分析、抽样技术、方差分析以及非参数统计中的方差分解

本文详细介绍了方差分解在统计学不同领域的应用,包括回归分析中的总离差平方和分解、抽样技术中的层间与层内方差、单因素与两因素方差分析,以及非参数统计中的Kruskal-Wallis和Friedman秩方差分析。通过方差分解,可以深入理解各种统计模型的内在结构和检验统计量的构建。
摘要由CSDN通过智能技术生成

在众多统计学领域的分支中,一个常见的公式就是方差分解,出现在回归分析非参数统计抽样技术等等。这篇文章做一个方差分解的梳理,公式是很简单的,重要的是明白这么做在不同分支下的意义是什么。

1 回归分析

在回归里面,我们通常有下面这个分解式:
S S T = S S R + S S E ∑ i = 1 n ( y i − y ˉ ) 2 = ∑ i = 1 n ( y ^ i − y ˉ ) 2 + ∑ i = 1 n ( y i − y ^ i ) 2 SST=SSR+SSE \\ \sum_{i=1}^n(y_i-\bar y)^2=\sum_{i=1}^n(\hat y_i-\bar y)^2 + \sum_{i=1}^n(y_i-\hat y_i) ^2 SST=SSR+SSEi=1n(yiyˉ)2=i=1n(y^iyˉ)2+i=1n(yiy^i)2
其中, SST是总离差平方和,表示因变量的变异;SSR是回归模型所解释的变异 ;SSE 就是回归模型所不能解释的变易。

这三个量对于回归来说太重要了,比如多元线性回归模型显著性F检验的构造结果就是
F = S S R / ( p ) S S E / ( n − p − 1 ) ∼ F ( p , n − p − 1 ) F=\frac{SSR/(p)}{SSE/(n-p-1)} \sim F(p,n-p-1) F=SSE/(np1)SSR/(p)F(p,np1)
其中,p为自变量 x i x_i xi的个数。

2 抽样技术

抽样技术里面的分层抽样,分层的目的就是去掉层间差异,只让层内差异影响估计量的方差,从而提升估计量的估计精度。

假设我们对总体分为 L L L层,每一层的单元个体数量为 N 1 , N 2 , . . . , N L N_1,N_2,...,N_L N1,N2,...,NL,设计的样本量分配为 n 1 , n 2 , . . . , n L n_1,n_2,...,n_L n1,n2,...,nL
∑ h = 1 L ∑ i = 1 n h ( y h i − y ˉ ˉ ) = ∑ h = 1 L n h ( y ˉ h − y ˉ ˉ ) 2 + ∑ h = 1 L ∑ i = 1 n h ( y h i − y ˉ h ) 2 \sum_{h=1}^L\sum_{i=1}^{n_h}(y_{hi}-\bar {\bar y}) = \sum_{h=1}^Ln_h(\bar y_h-\bar{\bar y})^2 + \sum_{h=1}^L\sum_{i=1}^{n_h}(y_{hi}-\bar y_h)^2 h=1Li=1nh(yhiyˉˉ)=h=1Lnh(yˉhyˉˉ)2+h=1Li=1nh(yhiyˉh)2
这一个分解式的左侧跟回归的实际上是一样的, y ˉ ˉ \bar{\bar y} yˉˉ表示的是每一层的均值 y ˉ h \bar y_h yˉh</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值