卡方检验(Chi-Squared Test ,
Test),是一种统计量的分布在零假设成立时近似服从卡方分布的假设检验。
卡方检验,一般指皮尔森卡方检验。是一种用途很广的假设检验方法,属于非参数检验
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
卡方检验针对分类变量。
小栗子
我们需要知道,卡方检验,是针对分类变量的,就是类似:性别(男、女),颜色(红、黄、蓝),婚姻状态(单身、已婚、离婚)等等
用卡方检验,来验证两个变量之间有没有关系(是否独立)
也就是说,性别和喜欢猫、狗是否有关系
1.在行和列上,对数据求和
2.期望值(理论值)
卡方检验需要一个理论值,这里理论值的计算,一开始没有看懂,是使用行的和*列的和/总和
这里不是很理解,为什么可以这样求理论值,有介绍说是极大似然估计方法,后面研究一下。
3.求卡方值
有了实际值和理论值,我们可以套用公式,计算卡方值
最后,卡方值是4.10
像我们这种2*2的表格,叫做独立样本四表格,自由度是1
自由度=(行数-1)* (列数-1)
先到这里,我继续学习一下,后续记录