皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数

给定两个连续变量x和y,皮尔森相关系数被定义为:


————————————————————————————————————————————————

由于原则上无法准确定义顺序变量各类别之间的距离,导致计算出来的相关系数不是变量间的关联性的真实表示。因此,建议对顺序变量使用斯皮尔曼相关系数。

斯皮尔曼相关系数的计算采用的是取值的等级,而不是取值本身。例如,给定三个值:33,21,44,它们的等级就分别是2,1,3.  计算斯皮尔曼相关系数的公式与计算皮尔森相关系数的类似,但用等级代替了各自的取值。


相对于皮尔森相关系数,斯皮尔曼相关系数对于数据错误和极端值的反应不敏感。

斯皮尔曼相关系数的另一种公式表示如下:



参考文献:Mamdouh Refaat, 信用风险评分卡研究——基于SAS的开发与实施

阅读更多
个人分类: 统计基础
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭