python机器学习 二分类 混淆矩阵_机器学习系列(三十一)——ROC曲线、多分类问题的混淆矩阵...

本文详细介绍了ROC曲线的概念及其在二分类问题中的应用,通过自定义模块和sklearn库展示了ROC曲线的绘制过程,并探讨了ROC曲线下面积作为评估模型性能的指标。此外,还讲解了多分类问题的混淆矩阵,如何分析错误分布并优化模型。
摘要由CSDN通过智能技术生成

本篇主要内容:ROC曲线、多分类混淆矩阵

ROC曲线

ROC全称是Receiver Operation Characteristic Curve,它描述的是TPR和FPR之间的关系。

7dbcadd40204

ROC曲线

TPR(True Positive Rate)的计算公式为:

math?formula=TPR%3D%5Cfrac%7BTP%7D%7BTP%2BFN%7D

它表示预测值为1,真实值也为1中预测正确的比例,TPR其实就是Recall。FPR(False Positive Rate)的计算公式为:

math?formula=FPR%3D%5Cfrac%7BFP%7D%7BTN%2BFP%7D

它表示预测值为1,真实值为0中预测错误的比例。和上篇文章中Precision和Recall负相关不同,TPR和FPR之间是正相关关系,TPR增加相应地FPR也会增加。

接下来使用我们自己的模块绘制ROC曲线,在这之前,首先在play_Ml模块的metrics.py中添加相关代码:

'''分类问题评价指标'''

import numpy as np

from math import sqrt

def TN(y_true, y_predict):

assert len(y_true)==len(y_predict)

return np.sum((y_true==0)&(y_predict==0))

def FP(y_true,y_predict):

assert len(y_true)==len(y_predict)

return np.sum((y_true==0)&(y_predict==1))

def FN(y_true,y_predict):

assert len(y_true)==len(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值