[Bug记录] sklearn中predict与predict_proba的识别结果不一致

最新推荐文章于 2022-05-19 15:23:39 发布

小刀丶

最新推荐文章于 2022-05-19 15:23:39 发布

阅读量4k

点赞数 2

分类专栏： AI 比赛文章标签： sklearn predict_proba 机器学习决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34361099/article/details/88696822

版权

AI 比赛专栏收录该内容

3 篇文章 0 订阅

订阅专栏

今天训练了好久的决策树模型在测试的时候发现个bug，使用predict得到的结果居然不是predict_proba中最大数值的索引！因为脚本中需要模型的置信度，所以希望拿到predict_proba的类别概率。

经过胡乱分析发现predict_proba得到的维度比总类别数少了几个，经过测试发现就是这个造成的，即训练集中有部分类别样本数为0。这个问题比较隐蔽，记录一下方便天涯沦落人绕坑。

Tip：在sklearn的train_test_split中有一个参数可以强制测试集和训练集的数据分布一致，也就不会导致缺类别的问题。

推广

🚀 AI Power 高性价比云GPU租借/出租平台：已预置Pytorch/TF等常用AI框架，赶论文、拼比赛的朋友不妨了解一下~ 现在注册并绑定（参考Github）即可获得高额算力，注册不涉及个人隐私信息，奖励可随时提现。详情请参考AI Power指南

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。