二分类变量相关性分析spss_SPSS分析技术:两个定类变量的相关系数(1)

基础准备

前面草堂君给大家详细介绍了各种相关系数种类,不同的相关系数用来表示不同类型变量之间的相关关系强弱,大家可以点击下方文章链接回顾:

  • 统计理论深度阅读:相关系数家谱(第一部)

  • 统计理论深度阅读:相关系数家谱(第二部)

接下来草堂君将给大家详细介绍不同相关系数的实际应用场景以及如何使用统计软件进行计算。知其然知其所以然,才能融会贯通和触类旁通。

相关分析的作用

开始正式文章前,草堂君先帮大家回顾一下相关分析的作用。相关分析能够得到两个结果,一个是显著性结果(p值),表示两个(组)变量是否是显著性相关;另一个相关系数,它用来表示两个变量的相关强度有多强,一般相关系数都在-1~1之间,越接近1和-1代表相关强度越强(正向和负向),越接近0,代表强度越弱。

相关系数越接近0,显著性(p值)约大,一般大于0.05(当然常用的显著性水平还有0.1、0.01和0.001)就认为两个变量没有显著性相关了;相关系数越接近-1或1,显著性(p值)越小,一般小于0.05就认为两个变量显著性相关了。

两个分类变量的相关系数

根据草堂君前面的介绍,适用于两个分类变量的相关系数有Phi系数、列联系数C(矫正列联系数C*)、Tshuprow‘s T系数、Cramer’s V系数、Theil‘s U系数和lambda系数。其中,Phi系数适用于2*2列联表;列联系数C和Tshuprow’s T适用于n*n列联表;Cramer’s V、lambda和Theil‘s U适用于n*m列联表。

86eb4222a5333aae084e571173c8e605.png

如上表所示,因为红色字体的四个相关系数都是基于卡方值设计的,所以今天草堂君先介绍前四种相关系数以及它们的案例应用和分析过程。

Phi系数

首先回顾Phi系数的计算公式,如下所示。从公式可知,Phi系数对卡方值进行了样本量修正,表示为平均到每个样本上的平均比率差异有多少,平均差异越大,Phi系数越大,表示两个定类型变量不是独立无关的,也就是两个定类型变量越相关。需要注意,如果两个

  • 4
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值