机器学习中分类模型的评估方法之--Kappa系数

最新推荐文章于 2024-01-25 14:39:21 发布

猪逻辑公园

最新推荐文章于 2024-01-25 14:39:21 发布

阅读量6k

点赞数 3

分类专栏：机器学习文章标签： kappa

机器学习专栏收录该内容

77 篇文章

订阅专栏

本文介绍了Kappa系数这一评估多分类模型准确度的方法。Kappa系数取值范围为[-1,1]，值越高，分类准确度越高。文章通过具体实例展示了如何计算Kappa系数，并提供了Python实现代码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Kappa系数

首先，我们介绍一下kappa系数：
kappa系数是用在统计学中评估一致性的一种方法，我们可以用他来进行多分类模型准确度的评估，这个系数的取值范围是[-1,1]，实际应用中，一般是[0,1]，与ROC曲线中一般不会出现下凸形曲线的原理类似。
这个系数的值越高，则代表模型实现的分类准确度越高。kappa系数的计算方法可以这样来表示：

k=(po−pe)/(1−pe)

其中，p0表示为总的分类准确度;
pe表示为

pe=a1×b1+a2×b2+...+aC×bC/n×n

其中，ai代表第i类真实样本个数，bi代表第i类预测出来的样本个数。

例子

例子数据来源:

https://blog.csdn.net/xtingjie/article/details/72803029

对于该表中的数据，则有：

po=(239+73+280)/664=0.8916

pe=(261×276+103×93+300×295)/664×664=0.3883

k=(po−pe)/(1−pe)=(0.8916−0.3883)/(1−0.3883)=0.8228

代码

用python语言来实现，则有:

def kappa(matrix):
n = np.sum(matrix)
sum_po = 0
sum_pe = 0
for i in range(len(matrix[0])):
sum_po += matrix[i][i]
row = np.sum(matrix[i, :])
col = np.sum(matrix[:, i])
sum_pe += row * col
po = sum_po / n
pe = sum_pe / (n * n)
# print(po, pe)
return (po - pe) / (1 - pe)
1234567891011121314

其中，matrix是一个方阵，若共有i个类别，则matrix.shape = (i,i).
用下面的代码进行测试:

import numpy as np
matrix = [
[239,21,16],
[16,73,4]
[6,9,280]]

matrix = np.array(matrix)
print(kappa(matrix))12345678

转自https://blog.csdn.net/xtingjie/article/details/72803029

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。