统计学——简单理解卡方检验

卡方检验是一种用于分析分类变量间关联性的非参数检验方法。在这个例子中,通过计算卡方值来检验性别与专业选择是否独立。通过对100名男生和100名女生的专业数据进行分析,得出卡方值为23.72,大于显著性水平0.05对应的临界值5.99,因此拒绝原假设,认为专业选择与性别存在显著相关性。
摘要由CSDN通过智能技术生成

卡方检验

什么是卡方检验

卡方检验用来分析两个分类变量之间是否显著相关,卡方检验属于非参数检验,由于非参检验不存在具体参数和总体正态分布的假设,所以有时被称为自由分布检验。
而区别参数检验和非参数检验的,就是看数据类型,分类变量无法计算平均值和方差,所以为非参数检验。
在这里插入图片描述

卡方检验的目的

确定样本对象落入各类别的比例是否与随机期望比例相等。

卡方检验分类

卡方检验分为两类:

  1. 拟合卡方检验:用于检验一个变量的观察频率(每个类别中的观察数)是否与预期的不同。换句话说,该检验决定了样本分布是否与群体分布相匹配。
  2. 独立卡方检验:也被称为关联卡方检验,它对两个变量进行比较,看它们是否彼此不同。

一般我们使用独立卡方检验比较多。

卡方检验案例

背景

我们随机选取100名男生和100名女生并询问专业,数据如下图所示:

心理学 英语 生物学
男生 35 50 15
女生 30 25 45

我们想要根据以上数据知道专业的选择是否跟性别有显著性。

原假设

H 0 H_0 H0:性别与专业选择是相互独立的,不存在相关性
H 1 H_1 H1:专业选择跟性别是有关的

确定和计算统计值——卡方值

我们计算表中所有行列的和

心理学 英语 生物学 行合计
男生 35 50 15 100
女生 30 25 45 100
列合计 65 75 60 200

计算预期频数

心理学 英语 生物学
男生 100×65/200=32.5 100×75/200=37.5 100×60/200=30
女生 100×60/200=32.5 100×75/200=37.5 100×60/200=30

由上可知:
观测频数O:调查得到的实际数据
预期频数E:列合计×行合计÷总计后得到的值

卡方值的计算公式如下:
在这里插入图片描述
我们可以计算每一个格子的值,如下:

心理学 英语 生物学
男生 ( 35 − 32.5 ) 2 32.5 = 0.19 \frac{(35-32.5)^2}{32.5}=0.19 32.5(3532.5)2=0.19
  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值