[机器学习]概率模型的可靠性曲线及校准

本文介绍了概率模型的可靠性曲线,作为评估朴素贝叶斯、SVM和逻辑回归等算法性能的指标。可靠性曲线越接近对角线,模型性能越好。通过sklearn的calibration_curve,展示了如何绘制和分析三种算法的可靠性曲线,结果显示Logistic回归表现突出。文章还提出了两种改进方法,包括调整n_bins参数和使用模型校准以优化曲线平滑度。
摘要由CSDN通过智能技术生成

1.什么是可靠性曲线?

可靠性曲线是一个概率类模型的评估指标,适用于朴素贝叶斯,SVM,逻辑回归等概率类算法。是以y预测值为横坐标,y真实值为纵坐标的曲线。
因此当我们画出的可靠性曲线越接近对角线时,我们认为这个学习器的性能越好。

2. 代码展示

sklearn的可靠性曲线和学习曲线相同都是不能直接画图而是返回画图所需要的值,因此下面代码是根据calibration_curve返回的值对三个算法的可靠性曲线的探索。在这里插入图片描述

from sklearn.datasets import make_classification as mc
import matplotlib.pyplot as plt
from sklearn.naive_bayes import GaussianNB # 导入高斯朴素贝叶斯
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression as LR
from sklearn.metrics import brier_score_loss # 导入布里尔分数
from sklearn.model_selection import train_test_split
from sklearn.calibration import calibration_curve # 对概率类模型进行校准,方法是分箱


#创建数据
x,y = mc(n_samples=100000,
         n_features= 20,
         n_classes= 2,
         n_repeated=
  • 0
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值