Kruskal-Wallis(详细)和卡方检验的介绍

1. Kruskal-Wallis介绍

Kruskal-Wallis也称为H 检验,是一种非参数检验,不需要知道原始数据的分布和总体参数。 KW检验是一种秩和检验,根据所有数据从小到大排序,算出每个数据的秩。其中Ri为每组的秩和,ni为每组的样本个数。当每组样本中的观察数目有 5 个或 5 个以 上,则样本统计量 KWC 的分布与自由度为 k-1 的 卡方分布非常接近。因此,KW 统计量可利用卡 方分布进行检验。
在这里插入图片描述
如果样本中存在结值(数据相同秩值的个数),则校正系数C为:
在这里插入图片描述
参考资料:
蒲 虎.Kruskal-Wallis 检验原理介绍及其应用[J].兴义民族师范学院学报.
python实现

from scipy import stats
A=[1,3,6,9,0]
B=[3,5,1,4,11,34]
C=[1,9,5,3,0,2,4,5,7,12]
kw=stats.kruskal(A,B,C).pvalue
print(kw)

stats.kruskal 官方详细介绍:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kruskal.html
在这里插入图片描述

在小样本的情况下:k=3,ni<=5时,KW统计量可通过表查询得到
在大样本情况下:ni>5时,N越大,kw在零假设下近似服从自由度为(k-1)的卡方分布,因此KW 统计量可利用卡 方分布进行检验。

Kruskal-Wallis方法举例:
有三个工厂生产一种零件,各工厂生产零件的重量(g)如下:
H0: 三个工厂生产的零件重量无显著差异
H1: 三个工厂生产的零件重量有显著差异
在这里插入图片描述
在这里插入图片描述
通过查卡方检验表可知,自由度为k-1=2,显著性水平为0.05的时候,卡方值为5.9915。KWC>5.9915。所以拒绝原假设,认为三组数据是有显著差异的。秩和最低的C组和秩和最低的B组是有差异的。

2.卡方检验的介绍

卡方检验是非参数检验的一种,主要比较两个或两个以上的变量之间是否有关联性。也就是在一定显著水平下比较实际次数与理论(期望)次数的差异。卡方值越大代表差异越大,卡方值为0代表实际值完全符合理论值。
H0:实际值与理论值没有显著差异。
卡方检验一般是对于无序分类变量在两组或多组之间的分布是否一致,除此之外,还有其他应用:
1.检验某种连续变量的分布是否与理论分布一致
2.检验某个分类变量的概率是否等于某个指定概率
3.检验某两个分类变量是否独立
4.检验某两种方法的结果是否一致

参考:
晋丹星.卡方检验在大学生英语期末成绩与学习方式分析中的应用[J].海外英语.
卡方检验统计量为:
在这里插入图片描述
其中Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。i水平的期望频数Ei = n * pi,k为单元格数。当n比较大时,卡方统计量近似服从k-1自由度的卡方分布。

python实现

from scipy import stats
A=[1,3,6,9,0]
B=[3,5,12,54,11]
chi=stats.chisquare(A,B).pvalue
print(chi)

stats.chisquare 官方详细介绍:
http://pageperso.lif.univ-mrs.fr/~francois.denis/IAAM1/scipy-html-1.0.0/generated/scipy.stats.chisquare.html

在这里插入图片描述

  • 22
    点赞
  • 169
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
### 回答1: Kruskal-Wallis检验是一种非参数检验方法,用于比较三个或更多组的中位数是否相等。在R语言中,可以使用kruskal.test()函数进行Kruskal-Wallis检验。该函数的语法如下: kruskal.test(formula, data) 其中,formula是一个公式对象,用于指定要比较的变量和分组变量;data是一个数据框,包含要比较的变量和分组变量。 例如,假设我们有一个数据框df,其中包含一个数值变量y和一个分组变量group,我们可以使用以下代码进行Kruskal-Wallis检验: kruskal.test(y ~ group, data = df) 该函数将返回一个Kruskal-Wallis检验的结果,包括统计量、自由度和p值等信息。如果p值小于显著性水平(通常为.05),则可以拒绝原假设,即认为不同组的中位数不相等。 ### 回答2: Kruskal-Wallis检验是用于比较不同组之间连续变量的中位数是否相等的一种非参数检验方法。对于不满足正态分布和方差齐性条件的数据,Kruskal-Wallis检验是一种有效的分析方法。本文将介绍R语言中执行Kruskal-Wallis检验的方法。 在R语言中进行Kruskal-Wallis检验需要使用kruskal.test()函数。该函数的语法为:kruskal.test(formula, data=NULL) 。其中,formula是一个公式对象,而data是一个数据框或矩阵。首先,要将数据按照研究问题分成不同的组,然后在公式对象中指定各组变量。 示例代码: 假设我们有一个数据集,包含3个组:group1、group2和group3,每个组中均有10个观测值。我们想比较这3个组的中位数是否相等。 # 首先,生成数据 set.seed(123) # 设定随机数种子 group1 <- rnorm(10, 0, 1) group2 <- rnorm(10, 0.5, 1) group3 <- rnorm(10, 1, 1) data <- data.frame(c(group1, group2, group3), rep(c("Group 1", "Group 2", "Group 3"), each=10)) # 对数据进行Kruskal-Wallis检验 kruskal.test(c(group1, group2, group3) ~ rep(c("Group 1", "Group 2", "Group 3"), each=10), data=data) 下面解释上面代码具体的意思: 1.首先,我们用set.seed()函数设定一个随机数种子。这是为了确保每次生成的随机数相同,以便于调试和复现结果。 2.然后,我们使用rnorm()函数生成三个组的随机数,分别表示group1、group2和group3的变量。这里每个组都有10个观测值。 3.将三个组的数据合并成一个向量,并使用data.frame()函数将其转换为数据框。在此过程中,我们使用rep()函数来指定每个观测值所属的组("Group 1"、"Group 2"和"Group 3")。 4.最后,我们使用kruskal.test()函数进行Kruskal-Wallis检验。在公式对象中,我们使用~符号来分隔变量和组信息,并使用data参数将数据框传递给函数。执行代码后,R将输出Kruskal-Wallis检验的结果。 需要注意的是,在使用kruskal.test()函数时,变量和组信息应该放在~符号的两边,且组信息中的每个组必须包含相同数量的观测值。如果不满足这些条件,函数将无法正确执行。 结论:执行Kruskal-Wallis检验时,我们需要将数据按照研究问题分成不同的组,并使用R语言中的kruskal.test()函数进行分析。该函数不仅可以计算Kruskal-Wallis统计量和p值,还可以输出检验结果的一些额外信息。 ### 回答3: Kruskal-Wallis检验是一种非参数性的检验方法,用于比较两个或多个组之间的中位数是否相同。其原假设为所有组的中位数相同,备择假设为至少有一组的中位数与其他组不同。 在R语言中,进行Kruskal-Wallis检验的函数为kruskal.test。该函数的输入为一个数据向量和一个分组变量,其中数据向量为待检验的数值变量,分组变量为相应的分组指示变量。使用方法为: kruskal.test(数据向量 ~ 分组变量) 例如,以下是一个基本的使用例子: data <- c(5, 6, 7, 4, 2, 3, 8, 6, 1) group <- c("A", "B", "A", "C", "B", "C", "A", "B", "C") kruskal.test(data ~ group) 输出的结果包括统计量(H值)、自由度、p值等信息,可以帮助我们判断是否拒绝原假设。如果p值小于显著性水平(通常为0.05),则可以拒绝原假设,认为组间至少有一组的中位数与其他组不同。 需要注意的是,kruskal.test函数默认的检验类型为两侧检验,也就是检验所有与其他组不同的组,所以p值通常是双尾的。如果需要进行单侧检验,则可以采用wilcox.test函数等其他方法。 总之,利用R语言进行Kruskal-Wallis检验,可以方便地比较多个组之间的差异,并判断是否存在显著性差异。同时,R语言提供了多种分析方法和可视化工具,可以更加深入地分析数据并得出结论。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值