机器学习面试之如何解决类别不平衡？

最新推荐文章于 2025-01-15 20:52:56 发布

GhostintheCode

最新推荐文章于 2025-01-15 20:52:56 发布

阅读量318

点赞数

分类专栏：面试机器学习人工智能文章标签：机器学习面试分类问题中类别不平衡

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GhostintheCode/article/details/96987504

版权

面试同时被 3 个专栏收录

29 篇文章

订阅专栏

10 篇文章

订阅专栏

5 篇文章

订阅专栏

机器学习面试之如何解决类别不平衡？

此内容是读西瓜书无意中看到的，觉得很重要，总结一下。
类别不平衡的基本策略是再缩放。
现有的技术大体分三类：（前提是反例比正例多）
欠采样：直接对训练集里面的反例进行欠采样其实就是取出一些反例，使得正反数量差不多，然后在进行学习。（代表算法EasyEnsemble）
过采样：与欠采样相反，对训练集里面的正例进行过采样。就是增加一些正例使得数量接近，在进行学习。（代表算法SMOTE）
阈值移动：直接用原始训练集进行学习，但在用训练好的分类器进行预测的时候，将下面的公式嵌入到其决策过程中，这就是阈值移动。

在进行上述技术时候，需要注意的地方在截图中。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。