画ROC为什么clf.predict_proba(X_train)[:, 1] 而不是[:,0]?

最新推荐文章于 2022-11-15 08:23:11 发布

weixin_41724971

最新推荐文章于 2022-11-15 08:23:11 发布

阅读量1.1k

点赞数 6

分类专栏： python编程机器学习

本文链接：https://blog.csdn.net/weixin_41724971/article/details/119600133

版权

python编程同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

机器学习

7 篇文章 0 订阅

订阅专栏

 y_train_prob = clf.predict_proba(X_train)[:, 1]

这行代码让我疑惑，它究竟是什么意思呢？

print(clf.predict(x_test))    # 返回预测标签

就是预测值是哪些

print(clf.predict_proba(x_test))    # 返回预测属于某标签的概率

就是属于某类预测值的概率是多少

而对于[:,1]

是取二维数组中第二维的所有数据

举个例子：

y_train_prob = clf.predict_proba(X_train)[:, 1]
print("clf.predict_proba(X_train)")
print(clf.predict_proba(X_train))
print("clf.predict_proba(X_train)[:, 1]")
print(y_train_prob)

输出是：

含义是：预测X_rain[1. 0. 1. ... 0. 1. 0.]的标签是0的概率为0.94005474 ，为1的概率为0.05994526

个人思考：在2分类中，clf.predict_proba(X_train)[:, 1] 是取标签为1的概率，来画ROC曲线。其实笔者认为取【：，0】和取【：，1】是一样的，因为从上面一段话可以看出，0的概率+1的概率=1。都可以用来计算ROC曲线，只不过一个是正的一个是负的ROC。ROC只需要计算真正值和伪正值即可。笔者的具体实验结果对比如下：

ROC曲线对比

取 [:,1]	取 [:,0]

如果与笔者思考有异，欢迎和笔者在留言区讨论 ~

weixin_41724971

关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
画ROC为什么clf.predict_proba(X_train)[:, 1] 而不是[:,0]?

y_train_prob = clf.predict_proba(X_train)[:, 1]这行代码让我疑惑，它究竟是什么意思呢？print(clf.predict(x_test)) #返回预测标签就是预测值是哪些print(clf.predict_proba(x_test)) #返回预测属于某标签的概率就是属于某类预测值的概率是多少而对于[:,1]是取二维数组中第二维的所有数据举个例子： y_train_prob = clf.pred...
复制链接

扫一扫

专栏目录