机器学习 Cohen s Kappa，Quadratic Weighted Kappa 详解

最新推荐文章于 2025-03-13 11:12:38 发布

张大千09

最新推荐文章于 2025-03-13 11:12:38 发布

阅读量1.5w

点赞数 15

分类专栏：机器学习文章标签：机器学习统计学数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43756456/article/details/106334076

版权

首先需要明确，Kappa系数既可用于统计中的一致性检验，也可以用于机器学习中来衡量分类精度。它们的本质是一样的，但是理解方式略有不同，本文将从机器学习的角度来阐述Kappa系数。

一、基本思想

一般来说，对于机器学习中的分类问题，最简单粗暴的衡量指标就是准确率（accuracy），但是对于样本标签分布极其不均衡的数据，准确率就会出现误导了。
比如对于如下数据集，100个样本中10个是猫，10个是狗，需要预测每个样本是猫还是狗。当我们直接预测所有样本都是狗时，我们的预测率就可以达到90%。
这个准确率会造成分类结果很好的误导，那么我们是否可以考虑构造一个新的指标，把这个90%的准确率作为baseline（定义其为0），而全部分类正确时定义为1，得到如下图中My_score的指标。
在这里插入图片描述

这个指标基本接近Kappa系数了，只是Kappa系数的baseline计算方式不同。

二、Kappa系数定义

1.一致性检验中对kappa系数的定义

这里借鉴一下一致性检验中对kappa的定义来理解，假设下图中的R1是预测的样本分布，R2是真实样本分布。OA是R1的预测准确率，

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。