推断性统计部分(四)---简单方差分析

推断性统计部分(四)—简单方差分析

标签(空格分隔): 概率论与数理统计


方差分析,分为单因素试验方差分析、多因素无重复试验方差分析及多因素试验方差分析三部分。在试验中,考察的指标称为试验指标,影响试验指标的条件称为因素(一般分为可控因素,如温度、剂量;不可控因素,如测量误差),因素所处的状态(状态这个词比较抽象,我所理解的,或许用子因素来描述会更好理解)称为该因素的水平,给出几个例子来说明三个部分的试验,也进一步理解上述定义:
例1、车间生产时,通常有多台机器生产同一样标准规格的产品,假如有三台机器在生产同一规格的铝合金薄板,我们要检验三台机器生产的一致性,即他们生产的厚度是否一致,还是有显著的差异。此时,厚度是我们所需要检验一致性的内容,所以厚度即为试验指标,机器即为因素,三台不同的机器即为机器的三个不同的水平(我所理解的就是三个子因素,或者用维度来表示因素,维度的子维度表示水平会让某些人容易理解一些),而其它条件如测试厚度的仪器是同一台,人员是同一个,原材料是同一批,等等其它因素的水平都一样,只有一个机器因素有不同水平。此时,称之为单因素试验。
例2、继续上面的例子,假如我还有一个原材料因素,它也有三个不同的水平,此时有两个不同的因素有不同的水平,检验目的是原材料及机器两个因素对生产薄板的厚度是否有显著影响,此时称之为双因素试验或多因素试验(当因素大于1个时,我们就可以叫多因素试验)。
例3、继续上面的例子,我们划分一下无重复试验及重复试验,假如在双因素试验中,我们每一个组合仅试验了一次,此时称为多因素无重复试验,若我们每一个组合均进行了多次试验,则称为多因素等重复试验,是否需要重复试验由能否确定因素之间的独立性来确定,可以确定各因素是独立的,则不需要进行重复试验,否则需要。

总的来说,方差分析就是检验不同因素的不同水平是否对试验指标有显著的影响
此处先给出方差分析的基本思想,就是把组内的方差(即同一因素同一水平下的方差)与组间的方差(同一因素不同水平的方差)进行显著性检验,若比值越大,即组内方差比组间方差大,说明影响主要来自组的内部,而不是不同水平,否则,影响来自组间,即各水平是显著不同的。

单因素试验方差分析

应用方差分析,包括后面的多因素试验方差分析,首先有三个前提:正态、等方差、独立。即,各水平的试验数据服从正态分布,各水平所构成的正态总体方差相等,各水平所收集到的试验数据是互相独立的。以上述例1来说,同一机器下生产的薄板厚度,我们可以看作是正态的;因为只有机器的水平不一样,其它因素都一样,所以总体均值的不一致是因为机器不同水平所产生的(属系统误差),而因其它随机因素的干扰造成的波动所形成的误差是随机误差,但因其它因素都一样,随机误差从理论上应该是一致的,所以可以认为总体的方差相同;从实际原理可知,各数据之间并无关联,独立性得证。

下面是解决方案:
1)先引入定义:
因素 A 的各个水平:A1A2A3As,各个观察结果为 Xij ,其中ij的意思为在 Aj 水平下的第i个观察结果。
总平均: X¯=μ=1nsj=1njμj=1nsj=1nji=1Xij ,其中 n 为总观察结果个数nj Aj 水平下的样本个数。
水平 Aj 下的样本均值: X¯j=1njnji=1Xij
误差平方和: SE=sj=1nji=1(XijX¯j)2 ,表示在水平 Aj 下,样本观察值与样本均值的差异,由随机误差所引起。
效应平方和: SA=sj=1nji=1(X¯jX¯)2=sj=1nj(X¯jX¯)2 ,表示在水平 Aj 下,样本均值与总均值的差异,由效应差异及随机误差引起。
总偏差平方和: ST=sj=1nji=1(XijX¯)2=SE+SA
2)解决方案:
当真实数值落在接受域内时,有 SA(s1) σ2 的无偏估计,落在拒绝域时,比 σ2 大,而 SE(ns) 则无论什么情况,都是 σ2 的无偏估计,于是,我们可以通过检验量 F=SA/(s1)SE/(ns)k 来拒绝效应平方和对整体方差的估计是无偏的,来进一步拒绝效应平方和与整体方差的一致性,即显著不一致,以此来达到我们的目的。
可以使用方差分析表来进行分析:

方差来源平方和自由度均方F比
因素 SA s1 S¯A=SAs1 F=S¯AS¯E
误差 SE ns S¯E=SEns
总和 ST n1

可以使用较为容易理解的公式来计算各项内容:

变量计算式描述
列和: Tj nji=1Xij,j=1,2,3,s 各水平下观察值的总和
总和: T sj=1nji=1Xij 所有观察值的总和
ST sj=1nji=1X2ijT2n 所有观察值平方的和减去总和平方除以总个数
SA sj=1nji=1X2jT2n=sj=1T2jnjT2n 以列均值代替各水平的具体数值来计算其偏差,因为 nji=1X2j 中,各 X2j 是一样的,所以可以化为 njX2j=(njXj)2nj=Tj2nj
SE STSA 二者之差

3)未知参数的估计
当拒绝原假设(即出现各水平间显著差异时),需要对各均值之差作区间估计,以确定两两之间的差距范围,于是使用枢轴量 t=(X¯jX¯k)(μjμk)S¯E(1nj1nk)t(ns) 来确定置信区间。

双因素无重复试验方差分析

双因素无重复试验可以看作是两个单因素试验的结合,方差分析表中加入第二个因素B,表中,A因素在行,B因素在列,如下:

方差来源平方和自由度均方F比
因素A SA r1 S¯A=SAr1 F=S¯AS¯E
因素B SB s1 S¯B=SBs1 F=S¯BS¯E
误差 SE (r1)(s1) S¯E=SE(r1)(s1)
总和 ST rs1

同样可以使用较为容易理解的公式来计算各项内容:

变量计算式描述
列和: Tj ri=1Xij,j=1,2,3,s 在因素B相同水平下,A因素各水平的观察值的总和
行和: Ti sj=1Xij,i=1,2,3,r 在因素A相同水平下,B因素各水平的观察值的总和
总和: T ri=1sj=1Xij 所有观察值的总和
ST sj=1ri=1X2ijT2rs 所有观察值平方的和减去总和平方除以总个数
SA 1sri=1T2iT2rs 以行均值代替因素A各水平的具体数值来计算其偏差
SB 1rsj=1T2jT2rs 以列均值代替因素B各水平的具体数值来计算其偏差
SE STSASB 三者之差

双因素等重复试验方差分析

在无重复试验中,加入因素A与因素B的交换效应:

方差来源平方和自由度均方F比
因素A SA r1 S¯A=SAr1 F=S¯AS¯E
因素B SB s1 S¯B=SBs1 F=S¯BS¯E
交互作用 SA×B (r1)(s1) S¯B=SA×B(r1)(s1) F=S¯A×BS¯E
误差 SE rs(t1) S¯E=SErs(t1)
总和 ST rst1

同样可以使用较为容易理解的公式来计算各项内容:

变量计算式描述
交互和: Tij tk=1Xijk,i=1,2,3,r,j=1,2,3,s 在相同因素相同水平下,各重复试验的观察值之和
列和: Tj ri=1tk=1Xijk,j=1,2,3,s 在因素B相同水平下,A因素各水平的观察值的总和
行和: Ti sj=1Xijtk=1Xijk,i=1,2,3,r 在因素A相同水平下,B因素各水平的观察值的总和
总和: T ri=1sj=1tk=1Xijk 所有观察值的总和
ST sj=1ri=1tk=1X2ijkT2rst 所有观察值平方的和减去总和平方除以总个数
SA 1stri=1T2iT2rst 以行均值代替因素A各水平的具体数值来计算其偏差
SB 1rtsj=1T2jT2rst 以列均值代替因素B各水平的具体数值来计算其偏差
SA×B (1tri=1sj=1T2ijT2rst)SASB 无有效理解,如有高人指点,不胜感激
SE STSASBSA×B 四者之差

通过检验等重复试验中的交互作用,其显著差异对方案搭配有着重大作用。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Sevan_Li

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值