单因素设计一元定量资料差异性分析(一)-- 单组设计一元定量资料 t检验 与 符号秩和检验、配对设计一元定量资料 t检验 与 符号秩和检验

单组设计一元定量资料 t检验 与 符号秩和检验

1.1.1 问题与数据

例1-1 已知玉米单交种群 105 的平均穗重为300克。喷药后,随机抽取九个果穗。其穗重分别为308g、305g、298g、315g、300g、321g、294g、320g。
问:喷药后,与喷药前的果穗平均重量之间的差别是具有统计学意义?

1.1.2 对数据结构的分析

在这个例子中,整个资料只涉及一个组,即用某法重复测定果穗重量9次,得到9个数据,故应属于“单组设计”。因指标(果穗重量)为测量得到且可以带小数,故该资料属于定量资料。即这是单组设计一元定量资料。

1.1.3 分析目的与统计分析方法的选择

该研究分析目的是考察该 9 个样品所代表的总体均值与标准值之间的差别是否有统计学意义。因此,统计分析应该属于单组设计定量资料的统计分析。若定量资料满足独立性正态分布要求,可进行单组设计一元定量资料 t检验,此时,可求出该定量指标的总体平均值95%置信区间;否则应该进行单组设计一元定量资料 符号秩和检验。此时,可基于非参数法求出该定量指标的总体中位数的95%置信区间。

1.1.4 SAS程序 和 重要内容的说明
data a;                /*建立数据集*/    
input X @@;            /*以下是输入变量*/ 
cards;
308 305 311 298 315 
300 321 294 320
;
run;
proc univariate
normal
mu0=300                /* mu 后为 零,不是O */
cibasic
cipctldf alpha=0.05;
var X;
run;

调用单变量分析过程。在此语句中,normal 选项要求对定量资料进行正态性检验。mu0=300 选项指定标准值为300, cibasic 选项要求基于正态分布分别计算该样本所代表的总体平均值、标准差和方差的95%置信区间,cipctldf 要求基于非参数法求置信区间,alpha=0.05 指定置信区间的显著性水平为 0.05,也就是计算95%置信区间。

1.1.5 主要分析结果及解释

1
首先看关于正态性检验的结果。W=0.954097、P=0.7350>0.05,可以认为这组定量数据服从正态分布。
在这里插入图片描述
再看 t 检验的结果。t=2.495401、P=0.0372<0.05,所以按照 α = 0.05 的水平,拒绝原假设 (H0:μ0 = 300),接受备择假设(H1:μ0 ≠ 300),可以认为喷药后果穗重量的均值与标准值(300g)之间的差别有统计学意义。
在这里插入图片描述
结论:
因为平均值为308g,标准值为300g,结合统计学结论,可认为喷药后果穗重量高于标准值(300g)。求得总体平均值的95%置信区间为(300.6,315.4)g。

1.2.1 问题与数据

例1-2 已知,某常规育种水稻平均单株产量为250g,经杂交培育后随机抽取10株。测得单株产量分别为272g、200g、268g、247g、267g、246g、373g、216g、206g、246g。
问杂交培育的水稻平均产量与常规育种水稻平均单株产量之间的差别是否具有统计学意义?

1.2.2 SAS程序示例:

方法1:

data b;
input X @@;          
cards;                         
272 200 268 247 267 246 373 216 206 246
;
run;
proc univariate
normal
mu0=250 /* mu 后为 零,不是O */
cibasic
cipctldf alpha=0.05;
var X;
run;

这个方法与例1-1的方法一样,注意要使用新的数据来替换原来的数据,记得把 mu0=300 改为 mu0=250。
下面给出第二种方法:

data b;
input X @@; 
Y=(X-250); 
cards;                         
272 200 268 247 267 246 373 216 206 246
;
run;
proc univariate
normal;
var Y;
run;
proc means;
var X;
run;

注意:这里 Y=(X-250); 是一个赋值语句,要根据具体情况修改标准值 250。
在这里插入图片描述
首先查看关于变量Y的正态性检验的结果,有 W=0.836851、P=0.0404<0.05,所以可以认为这组定量资料不服从正态分布。
下面来看看符号秩和检验的结果:
在这里插入图片描述
位置检验:
mu0=0 的最后一行。
S=-2.5 、P=0.8262 >0.05,所以按照α=0.05的水平,认为此样本所代表的总体中位数与给定的标准值 250 g 之间的差别无统计学意义(接受原假设)。
在这里插入图片描述
结论:
可以认为该类水稻杂交后的单株产量的总体中位数与常规育种的平均单株产量(250g)接近相等。求得中位数为246.5g,其95%置信区间为(206.0,272.0)。
在本例中由于。变量X并不服从正态分布,所以描述其平均水平时使用中位数,相应的需要计算中位数的95%置信区间。

配对设计一元定量资料 t检验 与 符号秩和检验

2.1 问题与数据

例 2-1 对血小板活化模型大鼠以 ASA 进行实验性治疗,以血浆 TXB2(ng/L)为指标,试进行统计分析。

大鼠号血浆 TXB2(ng/L)血浆 TXB2(ng/L)
给药前给药后
1250184
2226205
………………
4176176
2.2 对数据结构的分析

整个资料涉及一个试验因素的两个水平,并且在这两个水平作用下获得的相同指标是成对出现的,每一对中的两个数据来自于同一个个体或条件相近的两个个体,故应属于“配对设计”。

2.3 分析目的与方法选择

对于例 2-1,研究分析目的是考察该10 对大鼠在给药前后血浆TXB2差值所代表总体差值与0之间的差别是否有统计学意义,因此统计分析应该属于配对设计定量资料的统计分析。若定量资料满足独立性和正态分布要求,可进行单组设计一元定量资料t检验,此时,可求出该定量指标的总体平均值的95%置信区间;否则,应进行配对设计一元定量资料符号秩和检验,此时,可基于非参数法求出该定量指标的总体中位数的95%置信区间。

2.4 SAS程序 和 重要内容的说明
DATA c;
/*建立数据集*/
/*以下是输入变量*/
INPUT x1 x2 @@;
d=x2-x1;
/*d为x2、x1的差值*/
CARDS;
250 184 226 205 180 182
356 248 280 196 210 204
276 214 326 274 208 200
176 176
RUN;

PROC UNIVARIATE 
NORMAL
CIBASIC 
CIPCTLDF 
alpha=0.05;
VAR d;
run;

对差值d进行单变量分析,并对d进行正态性检验。在该语句中,NORMAL选项要求对定量资料进行正态性检验,CIBASIC 选项要求分别计算该样本所代表的总体平均值、标准差和方差的95%置信区间,CIPCTLDF 要求基于非参数法求置信区间,alpha=0.05 指定置信区间的显著性水准为 0.05,也就是计算95%置信区间。

2.5 主要分析结果及解释

在这里插入图片描述
对于例2-1,首先查验正态性检验的结果。d变量正态性检验的结果: W=0.902699 、P=0.2345>0.05,可看出差值符合正态分布,故选用 t检验 的结果: t= -3.27465, P=0.0096,
在这里插入图片描述
按α =0.05水准,认为平均来说给药前后血浆TXB2 (ng/L) 之间的差别有统计学意义(拒绝原假设)。
结论:
因给药后与给药前的血浆TXB2差值的平均值 -40.500 小于 0 ,结合统计学结论,可认为 ASA 药物可降低大鼠血浆TXB2 (ng/L)的含量。
在这里插入图片描述
好了,先写这么多,如果觉得对你有帮助的话,可以动动你的手指,点个赞吗Thanks♪(・ω・)ノ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值