机器学习实战01:手动计算ROC-AUC

本文介绍了ROC曲线的原理和AUC的计算方法。通过手动创建预测值与真实值,逐步解释如何根据阈值变化计算FPR和TPR,形成ROC曲线,并最终计算AUC。示例中展示了从计算单个坐标到模拟sklearn库的ROC图过程,以及AUC的计算公式和实现。
摘要由CSDN通过智能技术生成
生信交流与合作请关注公众号@生信探索
生信交流与合作请关注公众号@生信探索

ROC(全称为Receiver operating characteristic,意为受试者特征曲线)是一个二维平面空间中一条曲线,而AUC则是曲线下方面积(Area Under Curve)的计算结果,是一个具体的值

x轴是FPR,y轴是TPR,曲线上的每个点就对应着一组(FPR,TPR)坐标,所以我们的任务就是计算出所有的(FPR,TPR)坐标然后用线把他们连接起来就形成了ROC曲线,而AUC可以通过曲线下面积计算而来。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import RocCurveDisplay

首先手动创建一组预测值和对应的真实值,0一般为负类,1为正类,而且正类多设置为研究中较为关心的标签,比如把1设置为肿瘤,或者疾病。

np.random.seed(1314)
geneA = np.random.uniform(size=10)
label = [0]*5 + [1]*5
df = pd.DataFrame({ 'geneA':geneA,'label':label})
df = df.sort_values('geneA',ascending=False)
df.reset_index(drop=True,inplace=True# 恢复行索引从0开始递增
df
  geneA  label
0  0.928483  1
1  0.864400  0
2  0.828642  1
3  0.749421  0
4  0.464414  1
5  0.407268  1
6  0.210935  0
7  0.140796  0
8  0.082719  0
9  0.012973  1

从1开始降低阈值࿰

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值