【SPSS笔记01】交叉分析表

交叉表用途&使用步骤

主要用途:主要用于分析分类变量相关关系,如果是连续变量的相关性,主要使用相关分析

Step1

分析——描述统计——交叉表
在这里插入图片描述

Step2

将对应的分类型变量分别放在行和列,选择Statistics中的卡方,通过假设检验判断量分类变量之间的关系
在这里插入图片描述

变量解释

①:卡方:选择卡方会计算Pearson 卡方、似然比卡方、Fisher 的精确检验和Yates 修正卡方(连续性修正)

②:对于行和列都包含排序值的表(比如客户的满意度),相关将生成Spearman 相关系数rho(仅数值数据)。Spearman 的rho 是秩次之间的关联的测量。

【注意:当两个表变量都是定量变量时,卡方将产生线性关联检验。相关产生Pearson 相关系数r,这是变量之间的线性关联的定量。】

③:对于名义变量(即数据大小没有实际意义且没有大小区分,如男1,女2)可以选择列联系数Phi(系数)Cramér 的VLambda(对称和非对称lambda 以及Goodman 和Kruskal的tau)和不确定性系数

1)相依系数:基于卡方的关联性测量,范围在[0,1),
0表示变量之间毫不相关,接近1表示相关性较大。
(具体的数值大小与变量的个数相关)

2)Phi and Cramer’s V. Phi :Phi=平方根(卡方检验统计量/样本大小),Cramer 的V 也是基于卡方统计量的关联性测量。

3)Lambda: 相关性测量,它反映使用自变量的值来预测因变量的值时,误差成比例缩小。值为1 表示自变量能完全预测因变量;值为0 表示自变量对于预测因变量没有帮助。

4)不确定系数:表示当一个变量的值用来预测其他变量的值时,误差成比例下降的程度。例如,值0.83 指示如果知道一个变量的值,则在预测其他变量的值时会将误差减少83%。程序同时计算不定性系数的对称版本和不对称版本。

在这里插入图片描述
④:对于有序变量(比如客户满意度,1代表非常不满意,5代表非常满意)
1)Gamma:两个有序变量之间的相关性的对称度量,它的范围是从-1 到1。绝对值接近1 的值表示两个变量之间存在紧密的关系。接近0 的值表示关系较弱或者没有关系。对于二阶表,显示零阶gamma。对于三阶表到n 阶表,显示条件gamma。
2)Sommer’s d:与Gamma相似,也反映两个有序变量之间相关性的测量:绝对值接近1的值表示两个变量之间存在紧密的关系,值接近0 则表示两个变量之间关系很弱或没有关系。Somers 的d 是gamma 的不对称扩展,不同之处仅在于它包含了未约束到自变量上的成对的数目。还将计算此统计量的对称版本。
3)Kendall’s tau-b:将结考虑在内的有序变量或排序变量的非参数相关性测量。系数的符号指示关系的方向,绝对值指示强度,绝对值越大则表示关系强度越高。可能的取值范围是从-1 到1,但-1 或+1 值只能从正方表中取得。
4)Kendall’s tau-c忽略结的有序变量的非参数关联性测量

⑤按区间标定:Eta
注意:如果是定量变量与定型变量之间分析,一定要选择Eta

Step3

点击单元格——选择计数(观察值表示基本的个数)——百分比(按需求选择按行、列划分百分比)
在这里插入图片描述

交叉表结果观察

在这里插入图片描述
如图,选择了按照行计算的百分比&总记得百分比:
比如,第一行第二列的数据为42.1%,代表男性中有42.1%的人认为日报周末版更适合在周末阅读

卡方分析的解释

卡方检验表格

主要看Pearson卡方检验,计算出的统计量为7.251,对应p=0.027<0.05,拒绝原假设。
①原假设为两变量相互独立,因此认为两分类变量不相互独立。
②概率论告诉我们不独立不一定相关,因此我们只能猜测两变量可能相关。
在这里插入图片描述

  • 14
    点赞
  • 96
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值