Kendall's Tau
Kendall's tau计算过程
仍以链接中的2名医生对6名病人评估健康水平为例,怎么样去衡量两名医生评估结果的一致性呢?
将6名病人的健康水平进行两两比较,总共需要做次比较。假如在15次比较中,两名医生认为的“更健康的人”是同一人的次数为C,意见不一致的次数为D,那么就得到了
如果每次比较,两名医生所认为的“更健康的人”都是同一人,那么可以认为评估结果是完全一致的,此时相关系数等于1
如果两名医生每次意见都相反,可以认为评估结果是完全相反,此时相关系数等于-1,相当于“一名医生按健康水平从低到高给病人排序的结果”刚好等同于“另一名医生从高到低排序的结果”
如果其中有一名医生在评估时,选择“更健康的人”是完全随机的,也就会有一半的次数两医生意见相同,另外一半次数意见不同,此时相关系数为0。
Kendall's tau有三种变体,这里只讲tau a和tau b,因为tau c我也不懂
仍以链接中的2名医生对6名病人评估健康水平为例,但是医生只能给出“健康,不健康,非常不健康”三种评分,这样一来,就会有一些病人的健康评分相等,称为“平局”,英文叫"tie"。计算过程仍然是把所有病人进行两两比较,总共有5种情况:
- 两名医生认为的“更健康的人”是同一人
- 两名医生认为的“更健康的人”不是同一人
- 两名医生都认为病人的健康水平相等
- 第一名医生认为病人的健康水平相等,第二名医生认为不相等
- 第二名医生认为病人的健康水平相等,第一名医生认为不相等
以上5种情况的出现次数分别计为C, D, Txy, Tx, Ty
注意到
再设,
于是
可见,没有平局的情况下,Txy=Tx=Ty=0,此时tau a和tau b相等
有平局的情况下,tau b的对策是“不计入Txy的情况,Tx和Ty的情况只部分计入”
为什么tau b要把平局情况排除在外呢?假设两名医生比较病人A和B的健康水平,一名医生认为B更健康,但是相差不太大,所以都评了“健康”;另一名医生认为A更健康,但相差不太大,于是也都评了"健康"。虽然评分是一样的,但两名医生的意见其实是相反的!这就意味着,平局情况下,既可能是意见一致,也可能是意见不一致,根本无法判断。
Kendall's W
全称Kendall's coefficient of concordance,简称KCC,取值范围是[0,1],适用于“m名医生(m2)给n名病人评估健康情况”的情况
假设有4名医生,给6名病人的健康情况从坏到好排序,最不健康的病人分数就是1,最健康的病人分数就是6,那么每个病人都有4个分数,可算出该病人所得分数的平均数,以此作为该病人的最终得分
如果4名医生给出的排序结果完全相同,那么所有病人的最终分数都是整数,不妨令,可得其方差为
如果每位病人从4名医生那里得到的分数都有高有低,那么其最终分数就会趋向于一个靠近中间的值,所有病人的最终分数的方差也就会变小,极端情况是“两名医生给病人打分完全相同,另两名医生打分也完全相同,但前两名医生从坏到好排序的结果刚好是后两名医生从好到坏排序的结果”,此时所有病人的最终分数都一样,方差为0
所以就得到,其中Var(a)表示所有病人最终分数的方差
如果我们把病人的最终分数定义为所有打分之和,而不是平均数,记为,显然有
此时公式可以写作