Somer’s D(Somers’ Delta)-顺序变量相关性分析方法

Somers’ Delta (Somers’ D) 是对有序变量对之间一致性的度量。

在统计学中,**Somers’D**有时被错误地称为 Somer’D,它是对两个可能相关的随机变量X和Y之间的序数关联的度量。Somers 'D等于-1时,表示 所有变量对都不一致。Somers 'D等于1时表示所有变量对都一致时。Somers 'D以 Robert H. Somers 的名字命名,他于 1962 年提出了它。

序数变量是有序的,例如从最好到最坏或从最小到最大(李克特量表(Likert scale )是比较流行的序数量表之一。)

图片

一致性度量告诉您两对变量是如何连接的。这种连通性是由一致性和不一致定义的。简而言之,一致对“匹配”而不一致对不匹配。

Delta 可以从列联表中的行类别预测列类别。更具体地说,不对称* Somers’ D 测量因变量的预测改进的程度,基于了解自变量的值。因此,在运行此测试时定义哪个变量是自变量以及哪个变量是因变量非常重要:您将获得 (X,Y) 和 (Y,X) 的两个不同结果。举一个简单的例子,假设您想知道客户满意度(1 到 5 的等级)是否取决于您的销售人员的友好程度(1 到 3 的等级)。如果您切换自变量和因变量,您将衡量客户满意度对销售人员的友好程度的影响。这可能是有趣的信息,但这不是您感兴趣的关系。

解释

Delta 是Pearson 相关系数的序数替代。与 Pearson 的 R 一样,Somers 'D 的范围是 -1 到 1:

-1 = 所有变量都不一致

1 = 所有对都一致

**Somers’ D 的大值(趋向于 -1 或 1)表明该模型具有良好的预测能力。较小的值(在任一方向上趋于零)表明该模型是一个较差的预测器。**假设您在友好的销售人员/客户满意度场景中的 Delta 为 0.549。客户满意度是因变量,因此可以说友好的销售人员将客户满意度提高了 54.9%。

Somers 'D 随着列联表维度的增加而增加,但确实倾向于低估表中的实际关联程度(Göktaş & İşçi,2011)。

正式定义

Somers ’ D 有多种定义。一种方法是“一致对的数量与不一致对的数量之差除以与自变量无关的对的总数”(牛津指数)。这个定义让您了解计算的复杂程度;找到一致/不一致的对不是一项快速的任务。此外,Delta 的具体公式取决于自变量的位置(Göktaş & İşçi,2011)。这就是通常使用软件来查找 Delta 的原因之一。

Somers ’ D 有时也用Kendall 的 Tau定义:

D(Y |X) = τ (X,Y)/ τ (X,X)

在哪里:

  • (X,Y) 是一对二元随机变量。

  • τ 是 Kendall 的 Tau。

或者,如果一个 X 大于另一个,则可以将其定义为两个对应条件概率之间的差值。Delta 和 Tau-b 之间的区别仅在于 Delta 校正了自变量上的并列对:

Somers’ D 与 Gamma

Somers 'D 和 Goodman 以及Kruskal 的 gamma 都可以找到两个有序变量之间的关联。与 Goodman 和 Kruskal 的 gamma 不同,Somers 'D 区分自变量和因变量。两者之间的区别可能是模糊的,但如果您知道您的数据和分析的目标(即,如果将一个变量标记为相关变量很重要),则应该清楚使用这两个过程中的哪一个。

存在两个版本的 Delta:不对称和对称。非对称版本是迄今为止最受欢迎的版本,也是您在使用软件(例如SPSS)时可能会遇到的版本。当您阅读“Somers’ D”时,您可能正在阅读非对称版本(尽管很多作者并未阐明这一点)。对称版本——其中两个变量都被忽略为独立或相关——确实存在,因此在解释结果之前澄清你使用的是哪个是明智的。

Somers’ D计算举例

假设独立(预测变量)变量X取三个值,0.25 ,0.5 , 或0.75,独立(结果)变量Y取两个值,0或1 . 下表包含观察到的X和Y组合:

( Y , X对的 频率)

图片

图片

因此, Somers '_D_等于

图片

按照之前定义,Somers’ D 的大值(趋向于 -1 或 1)表明该模型具有良好的预测能力。较小的值(在任一方向上趋于零)表明该模型是一个较差的预测器。该Somers 'D等于0.34,表示模型预测能力较差。

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

欢迎学习csdn学院更多金融风控相关知识《python金融风控评分卡模型和数据分析》
在这里插入图片描述

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python机器学习建模

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值