单因素方差分析

数学模型

​ 把水平 Ai A i 下的试验结果 xi1,xi2,,xini x i 1 , x i 2 , ⋯ , x i n i 看成来自第 i i 个正态总体XiN(μi,σ2)的样本观察值,其中, μ μ , σ2 σ 2 未知,并且每个总体 Xi X i 都相互独立,考虑线性模型

xij=μi+ϵij,i=1,2,,r,j=1,2,,ni(1) (1) x i j = μ i + ϵ i j , i = 1 , 2 , ⋯ , r , j = 1 , 2 , ⋯ , n i

​ 其中, ϵi,j N(0,σ2) ϵ i , j ∼   N ( 0 , σ 2 ) 相互独立, μi μ i 为第 i i 个总体的均值,ϵij为相应的试验误差。

​ 比较因素 A A r个水平的差异归结为比较这 r r 个总体均值,即检验假设:

(2)H0:μ1=μ2==μr,H1:μ1,μ2,,μr

​ 记, μ=1ni=1nniμi,n=i=1nni,αi=μiμ μ = 1 n ∑ i = 1 n n i μ i , n = ∑ i = 1 n n i , α i = μ i − μ i,其中 μ μ 表示总和的均值, αi α i 为水平 Ai A i 对指标的效应,不难验证 i=1rniαi=0 ∑ i = 1 r n i α i = 0

​ 模型可以等价表示为

xij=μi+ϵij,i=1,2,,r,j=1,2,,ni;ϵijN(0,σ2)i=1rniαi=0(3) (3) { x i j = μ i + ϵ i j , i = 1 , 2 , ⋯ , r , j = 1 , 2 , ⋯ , n i ; ϵ i j ∼ N ( 0 , σ 2 ) 且 相 互 独 立 ∑ i = 1 r n i α i = 0

​ 称模型 (2) ( 2 ) 为单因素方差分析数学模型,它是一个线性模型。

方差分析

 式 (2) ( 2 ) 等价于:

H0α1=α2==αr=0,H1:α1,α2,,αr(4) (4) H 0 ; α 1 = α 2 = ⋯ = α r = 0 , H 1 : α 1 , α 2 , ⋯ , α r 不 全 为 零

 如果 H0 H 0 被拒绝,则说明因素 A A 各水平的效应之间有显著的差异,否则差异不明显。

以下导出H0的检验统计量,方差分析法是建立在平方和分解和自由度分解的基础上的,考虑统计量:

ST=i=1rj=1ni(xijx¯¯¯)2,x¯¯¯=1ni=1rj=1nixij S T = ∑ i = 1 r ∑ j = 1 n i ( x i j − x ¯ ) 2 , x ¯ = 1 n ∑ i = 1 r ∑ j = 1 n i x i j

 称 ST S T 为总离差平方和(或称总变差),它是所有数据 xij x i j 与总平均值 x¯¯¯ x ¯ 的差的平方和,它描绘了所有数据的离散程度,可以证明如下平方和分解公式:
ST=SE+SA(5) (5) S T = S E + S A

其中:
ST=i=1rj=1ni(xijx¯¯¯i)2,x¯¯¯i=1nj=1nixij,SA=i=1rj=1ni(xix¯¯¯)2=i=1rni(xix¯¯¯)2 S T = ∑ i = 1 r ∑ j = 1 n i ( x i j − x ¯ i ⋅ ) 2 , x ¯ i ⋅ = 1 n ∑ j = 1 n i x i j , S A = ∑ i = 1 r ∑ j = 1 n i ( x i ⋅ − x ¯ ) 2 = ∑ i = 1 r n i ( x i ⋅ − x ¯ ) 2

SE S E 表示随机误差的影响,这是因为对于固定的 i i 来讲,观测值xi1,xi2,,xini是来自同一个正态总体 N(μi,σ2) N ( μ i , σ 2 ) 的样本,因此,他们之间的差异是由于随机误差所导致的,而 j=1ni(xijx¯¯¯i)2 ∑ j = 1 n i ( x i j − x ¯ i ⋅ ) 2 是这 ni n i 个数据的变动平方和,正是它们之间的差异大小的度量,将 r r 组这样的变动平方和相加,就得到了SE,通常成 SE S E 为误差平方和或者组内平方和。

SA S A 表示在水平 Ai A i 下样本均值与总均值之间的差异之后,它反映了 r r 个总体均值之间的差异,因为x¯i是第 i i 个总体的样本均值,它是μi的估计,因此 r r 个总体均值μ1,μ2,,μr之间的差异越大,这些样本均值 x¯¯¯1,x¯¯¯2,x¯¯¯r x ¯ 1 , x ¯ 2 , ⋯ , x ¯ r 之间的差异越大,平方和 i=1rj=1ni(xix¯¯¯)2 ∑ i = 1 r ∑ j = 1 n i ( x i ⋅ − x ¯ ) 2 正是这种差异大小的度量,这里 ni n i 反映了第 i i 个总体的 样本大小在平方和SA中的作用,称 SA S A 为因素 A A 的效应平方和或组间平方和。

 式表明,总平方和可按其来源分为两个部分,一部分是误差平方和,它是由随机误差引起的,另一部分是因素的效应平方和,它是因素各水平的差异引起的。

 式(5)表明,总平方和 ST S T 可按其来源分为两个部分,一部分是误差平方和 SE S E ,它是由随机误差引起的,另一部分是因素 A A 的效应平方和SA,它是因素 A A 各水平的差异引起的。

由模型假设(1),经过统计分析得到 E(SE)=(nr)σ2 E ( S E ) = ( n − r ) σ 2 ,即 SEnr S E n − r σ2 σ 2 的一个无偏估计,且 SEσ2χ2(nr) S E σ 2 ∼ χ 2 ( n − r )

如果假设 H0 H 0 成立,则有 E(SA)=(r1)σ2 E ( S A ) = ( r − 1 ) σ 2 ,即 SAr1 S A r − 1 也是 σ2 σ 2 的一个无偏估计,且 SEσ2χ2(r1) S E σ 2 ∼ χ 2 ( r − 1 ) ,并且 SE S E SA S A 独立,因此,当假设 H0 H 0 成立是,有:

F=SA/(r1)SE/(nr)F(r1,nr)(6) (6) F = S A / ( r − 1 ) S E / ( n − r ) ∼ F ( r − 1 , n − r )

 于是 F F 可以作为H0的检验统计量,对于给定的显著性水平 α α ,用 Fα(r1,nr) F α ( r − 1 , n − r ) 表示 F F 分布的上α分位点,如果 F>Fα(r1,nr) F > F α ( r − 1 , n − r ) ,则拒绝原假设,认为因素 A A r个水平有显著差异,可以通过计算 p p 值的方法来决定是接受还是拒绝H0,其中 p p 值为P{F(r1,nr)>F},它表示的是服从自由度为 (r1,nr) ( r − 1 , n − r ) F F 分布的随机变量取值大于F的概率,显然, p p 值小于α等价于 F>Fα(r1,nr) F > F α ( r − 1 , n − r ) ,表示在显著性水平 α α 下的小概率事件发生了,这意味着应该拒绝原假设 H0 H 0 ,当 p p 值大于α,则不能拒绝原假设,所以应该接受原假设 H0 H 0
 单因素方差分分析表为:
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值