R实验非参数性检验（二）_在某鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进-CSDN博客

本文链接：https://blog.csdn.net/Jiangxia13/article/details/139214616

实验目的：

了解符号检验，掌握Wilcoxon符号秩检验，Wilcoxon秩和检验；

掌握Pearson拟合优度c2检验，Shapiro-Wilk 正态性检验，了解Kolmogorov-Smirnov单样本和双样本检验）；

实验内容：

（习题6.2）在某养鱼塘中，根据过去经验，鱼的长度的中位数为14.6cm，现对鱼塘中鱼的长度进行一次估测，随机地从鱼塘中取出10条鱼长度如下（单位：cm）：

13.32 13.06 14.02 11.86 13.58 13.77 13.51 14.42 14.44 15.43

（存放在fish.data文件中）（1）用符号检验分析；（2）用Wilcoxon符号秩检验。将它们作为一个样本进行检验，试分析，该鱼塘中鱼的长度是在中位数之上，还是在中位数之下。

提示：单个总体的中位数检验。

解：

（1）用符号检验分析

提出假设：

H0：M = 14.6

H1：M ≠ 14.6

源代码及运行结果：（复制到此处，不要截图）

> X<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\fish.data")


> binom.test(sum(X>14.6),length(X))

Exact binomial test

data: sum(X > 14.6) and length(X)

number of successes = 1, number of trials = 10,

p-value = 0.02148

alternative hypothesis: true probability of success is not equal to 0.5

95 percent confidence interval:

0.002528579 0.445016117

sample estimates:

probability of success

0.1

结论：

P值（=0.02148）＜0.05，拒绝原假设，并且置信区间【0.002528579，0.445016117】＜0.05，即鱼的长度在中位数之上。

（2）用Wilcoxon符号秩检验分析

提出假设：

H0：M ＝ 14.6

H1：M ≠ 14.6

源代码及运行结果：（复制到此处，不要截图）

> X<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\fish.data")


> wilcox.test(X,mu=14.6,exact = F,conf.int = T)

Wilcoxon signed rank test with continuity

correction

data: X

V = 4.5, p-value = 0.02174

alternative hypothesis: true location is not equal to 14.6

95 percent confidence interval:

13.06002 14.43996

sample estimates:

(pseudo)median

13.74995

结论：P值（=0.0217）＜0.05，拒绝原假设，并且中位数的置信区间可知，这批鱼的长度在中位数之上。

（习题6.4）用两种不同的测定方法测定同一种中草药的有效成分，共重复20次，得到实验结果如下表所示(数据存放在 method.data 文件中). （1）试用符号检验法检验两测定有无显著差异；（2）试用 Wilcoxon 符号秩检验法检验两测定有无显著差异；（3）试用 Wilcoxon 秩和检验法检验两测定有无显著差异。

	方法A	方法B		方法A	方法B		方法A	方法B
1	48.0	37.0	8	36.0	36.0	15	52.0	44.5
2	33.0	41.0	9	11.3	5.7	16	38.0	28.0
3	37.5	23.4	10	22.0	11.5	17	17.3	22.6
4	48.0	17.0	11	36.0	21.0	18	20.0	20.0
5	42.5	31.5	12	27.3	6.1	19	21.0	11.0
6	40.0	40.0	13	14. 2	26.5	20	46.1	22.3
7	42.0	31.0	14	32.1	21.3

两种不同的测试方法得到的结果

提示：两个总体的中位数检验。

解：

（1）用符号检验分析（提示：以两个样本之差>0的个数作为成功的个数）

提出假设：

H0：M = 0

H1：M ≠ 0

源代码及运行结果：（复制到此处，不要截图）

> X<-read.table("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\method.data",header = T)

> Y<-(X$A-X$B)

> binom.test(sum(Y>0),length(Y))

Exact binomial test

data: sum(Y > 0) and length(Y)

number of successes = 14, number of trials = 20,

p-value = 0.1153

alternative hypothesis: true probability of success is not equal to 0.5

95 percent confidence interval:

0.4572108 0.8810684

sample estimates:

probability of success

0.7

结论：P值（=0.1153）＞0.05，接受原假设，即测试中草药成分方法A与方法B无显著性差异。

（2）用Wilcoxon符号秩检验分析

提出假设：

H0：M = 0

H1：M ≠ 0

源代码及运行结果：（复制到此处，不要截图）

> X<-read.table("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\method.data",header = T)

> M<-(X$A - X$B)

> wilcox.test(M,,exact = F)

Wilcoxon signed rank test with continuity

correction

data: M

V = 136, p-value = 0.005191

alternative hypothesis: true location is not equal to 0

结论：P值（=0.00519）＜0.05，拒绝原假设，即测试中草药成分方法A与方法B存在显著性差异。

（3）用Wilcoxon秩和检验分析

提出假设：

H0：A - B = 0

H1：A - B ≠ 0

源代码及运行结果：（复制到此处，不要截图）

> X<-read.table("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\method.data",header = T)

> wilcox.test(X$A,X$B,paired = T,exact = F)

Wilcoxon signed rank test with continuity

correction

data: X$A and X$B

V = 136, p-value = 0.005191

alternative hypothesis: true location shift is not equal to 0

结论：P值（=0.00519）＜0.05，拒绝原假设，即测试中草药成分方法A与方法B存在显著性差异。

（习题6.5）为比较一种新疗法对某种疾病的治疗效果，将40名患者随机地分为两组，每组20人，一组采用新疗法，另一组用原标准疗法。经过一段时间的治疗后，对每个患者的疗效作仔细的评估，并划分为差、较差、一般、较好和好5个等级。两组处于不同等级的患者人数下表所示。试分析，由此结果能否认为新方法的疗效显著地优于原疗法。（a =0.05）

等级	差	较差	一般	较好	好
新疗法组	0	1	9	7	3
原疗法组	2	2	11	4	1

不同方法治疗后的结果

解：提出假设：

H0：M1 - M2 = 0

H1：M1 - M2 ≠ 0

源代码及运行结果：（复制到此处，不要截图）

> New<-rep(1:5,c(0,1,9,7,3))> Old<-rep(1:5,c(2,2,11,4,1))

> wilcox.test(New,Old,exact = F)

Wilcoxon rank sum test with continuity correction

data: New and Old

W = 266, p-value = 0.05509

alternative hypothesis: true location shift is not equal to 0

结论：P值（=0.05509）＞0.05，接受原假设，即认为新方法的疗效与原疗法没有显著性差异。

（习题6.6）Mendel用豌豆的两对相对性状进行杂交实验，黄色圆滑种子与绿色皱缩种子的豌豆杂交后，第二代根据自由组合规律，理论分离比为

黄圆：黄皱：绿圆：绿皱 = ( 9/16)：(3/16)：(3/16)：(1/16)

实际实验值为：黄圆315粒、黄皱101粒、绿圆108粒、绿皱32粒，共556粒。问此结果是否符合自由组合规律的理论分离比？

解：提出假设：

H0：p1 = 9/16，p2 = 3/16，p3 = 3/16，p4 = 1/16

H1：p1 ≠ 9/16，p2 ≠ 3/16，p3 ≠ 3/16，p4 ≠ 1/16

源代码及运行结果：（复制到此处，不要截图）

> chisq.test(c(315,101,108,32),p = c(9,3,3,1)/16)

Chi-squared test for given probabilities

data: c(315, 101, 108, 32)

X-squared = 0.47002, df = 3, p-value = 0.9254

结论：P值（=0.9254）＞0.05，接受原假设，即豌豆杂交结果符合自由组合定律的分离定律。

（习题6.7）观察每分钟进入某商店的人数X，任取200分钟，所得数据如下：

顾客人数	0	1	2	3	4	5
频数	92	68	28	11	1	0

试分析，能否认为每分钟顾客数X服从Poisson分布（a =0.1）。

解：提出假设：

H0：X服从Poisson分布

源代码及运行结果：（复制到此处，不要截图）

> X<-0:5> Y<-c(92,68,28,11,1,0)

> lambda<-weighted.mean(X,Y)

> x<-0:4> y<-c(92,68,28,12)

> F<-ppois(x,lambda);m<-length(y)

> p<-F[1];p[m]<-1-F[m-1]

> for (i in 2:(m-1)) p[i] <- F[i] - F[i-1]> (chi<-chisq.test(y,p = p))

Chi-squared test for given probabilities

data: y

X-squared = 0.91132, df = 3, p-value = 0.8227

结论：P值（=0.8227）＞0.05，接受原假设，即分钟顾客数X服从Poisson分布

（习题6.10）对习题6.2的数据做正态性检验。问该数据是否能做T检验？如果能，请做T 检验。结合习题6.2，分析各种的检验方法，试说明哪种检验法的效果最好。

解：提出假设：

H0：鱼的长度服从正态分布

源代码及运行结果：（复制到此处，不要截图）

> X<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\fish.data")Read 10 items

> shapiro.test(X)

Shapiro-Wilk normality test

data: X

W = 0.96883, p-value = 0.8798

结论：P值（=0.8798）＞0.05，接受原假设，即鱼的长度服从正态分布。由于题目样本量较小使用Wilcoxon符号秩和检验可能更为适合。

35位健康男性在未进食前的血糖浓度如下所示，

87 77 92 68 80 78 84 77 81 80 80 77 92 86 76

81 90 84 86 80 68 77 87 76 77 78 92 75 80 78

80 81 75 77 72

试用KS方法检验这组数据是否服从均值 μ =80，标准差 σ =6的正态分布？

解：提出假设：

H0：数据服从均值 μ =80，标准差 σ =6的正态分布

源代码及运行结果：（复制到此处，不要截图）

> bs<-c(87,77,92,68,80,78,84,77,81,80,80,77,92,86,76,81,90,84,86,80,68,77,87,76,77,78,92,75,80,78,80,81,75,77,72)

> ks.test(bs,"pnorm",mean = 80,sd = 6,exact = T)

Exact one-sample Kolmogorov-Smirnov test

data: bs

D = 0.1481, p-value = 0.3883

alternative hypothesis: two-sided

结论：P值（=0.3883）＞0.05，接受原假设，即数据服从均值 μ =80，标准差 σ =6的正态分布。

思考：

符号检验、Wilcoxon符号秩检验和Wilcoxon秩和检验针对的哪一类型的数据？A.连续型变量；B.无序分类变量；C.有序分类变量

B.无序分类变量

顺序统计量与秩统计量是一样的吗？在R语言中分别利用什么函数可以求得？秩统计计量是按顺序排列还是按降序排列？

顺序统计量 quantile()

秩统计量 rank()、order()

按顺序排列