使用cohen kappa系数衡量分类精度

Cohen Kappa 系数是一种衡量分类一致性或精度的指标,常用于医疗诊断的一致性评估。除了在临床试验中广泛应用,它也被用在kaggle竞赛中作为分类精度的评价标准。Kappa系数考虑了机遇符合率,取值范围为0到1,值越大表示一致性或分类精度越高。Kappa系数分为简单Kappa、加权Kappa(包括线性和平方加权)等类型,针对不同情况选择不同的计算方式,如有序分类变量的一致性检验通常使用加权Kappa。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在诊断试验中,研究者希望考察不同诊断方法在诊断结果上是否具有一致性。如评价两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性。1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明,它是一个描述诊断的一致性较为理想的指标,因此在临床试验中得到广泛的应用。下文给出的例子也都是基于医疗诊断的,可见其提出背景。除此之外,kappa系数也可用于衡量分类精度,在kaggle竞赛中经常被用作评价指标,如2019 data science bowlPetFinder.my Adoption Prediction等等。

由于诊断试验一致性的大小不完全取决于研究者的临床经验和诊断能力,还可能是由于机遇因素的作用,致使不同研究者得出相同的诊断结论。即没有受过专业医疗教育的人对患者进行诊断也可能会得出与专业医生一样的结论,而这种一致性结论完全是由于机遇因素导致的。kappa系数即是在一致性判断中剔除机遇因素的影响。kappa取值为[0,1],值越大代表一致性越强/分类精度越高。

kappa系数的计算分为以下几类,下面将通过例子介绍这几种kappa系数如何计算。

  • 简单kappa(simple kappa)
  • 加权kappa(weighted kappa)
    • 线性加权(linear weighted k
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值