关键词:卡方检验和相关性分析、卡方检验 相关性分析
一、相关分析方法的选择及指标体系
(一)两个连续变量的相关分析
1、Pearson相关系数
最常用的相关系数,又称积差相关系数,取值-1到1,绝对值越大,说明相关性越强。该系数的计算和检验为参数方法,适用条件如下:
(1)两变量呈直线相关关系,如果是曲线相关可能不准确。
(2)极端值会对结果造成较大的影响
(3)两变量符合双变量联合正态分布。
2、Spearman秩相关系数
对原始变量的分布不做要求,适用范围较Pearson相关系数广,即使是等级资料,也可适用。但其属于非参数方法,检验效能较Pearson系数低。
(二)有序分类变量的相关分析
有序分类变量的相关性又称为一致性,即行变量等级高的列变量等级也高,如果行变量等级高而列变量等级低,则称为不一致。
常用的统计量有:Gamma、Kendall的tau-b、Kendall的tau-c等。
(三)无序分类变量的相关分析
最常用的为卡方检验,用于评价两个无序分类变量的相关性。根据卡方值衍生出来的指标还有列联系数、Phi、Cramer的V、Lambda系数、不确定系数等。
OR、RR也是衡量两变量之间的相关程度的指标。
分类变量可分为无序变量和有序变量两类。
A、无序分类变量是指所分类别或属性之间无程度和顺序的差别。
无序分类又可分为:
1、二项分类,如性别(男、女),药物反应(阴性和阳性)等;
2、多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。
对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。
B、有序分类变量是指各类别之间有程度的差别。
如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量的频数表,所得资料称为等级资料。
二、SPSS相关操作
SPSS的相关分析散布在交叉表和相关分析两个模块中。
(1)交叉表过程
如下图:
SPSS相关分析(Pearson、Spearman、卡方检验)
SPSS相关分析(Pearson、Spearman、卡方检验)
以上的指标很全面,解释如下:
(1)“卡方”复选框:为常用的卡方检验,适用于两个无序分类变量的检验。
(2)“相关性”复选框:适用于两个连续性变量的相关分析,给出两变量的Pearson相关系数和Spearman相关系数。
(3)“有序”复选框组:包含了一组反映有序分类变量一致性的指标,只能用于两变量均为有序分类变量的情况。
(4)“名义”复选框组:包含一组分类变量相关性的指标,有序和无序分类时都可使用,但变量为有序时,检验效能没有“有序”复选框组中的统计量高。
(5)Kappa:为内部一致性系数。
(6)风险:给出OR或RR值。
(7)McNemar:为配对卡方检验。
(二)“相关”过程
如下图:
SPSS相关分析(Pearson、Spearman、卡方检验)
SPSS相关分析(Pearson、Spearman、卡方检验)
可以计算Pearson、Kendall的tau-b、Spearman三种相关系数。