数据样本类别不平衡

最新推荐文章于 2024-08-17 21:57:23 发布

_missTu_

最新推荐文章于 2024-08-17 21:57:23 发布

阅读量1k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013075024/article/details/90515161

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

标题训练集中类别不平衡，会引起什么评估指标最不准确？

准确度（Accuracy）
（注意与精度区分）
对于二分类问题来说，正负样例比相差较大为99:1，模型更容易被训练成预测较大占比的类别。因为模型只需要对每个样例按照0.99的概率预测正类，该模型就能达到99%的准确率。

样本不均衡（数据倾斜）解决办法？

数据层面

1. 上采样：
Smote过采样方法，基于插值来为少数类合成新的样本（构建新的样本）。
2. 下采样：
随机丢弃一部分负样本。

评估指标层面

1. 使用更有说服力的评价指标
准确率在类别不平衡数据上，说服力比较差；可考虑AUC、F1值等。

模型层面

1. 代价敏感方法—对模型采用惩罚
通过增加分错小样本类别的权重，降低分对的大样本类别的权重，使得分类器格外关注小样本类别数据.

2. 分类器集成

使用能够解决数据倾斜的模型，例如，使用xgboost模型。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄11年

101
原创

160
点赞

770
收藏

53
粉丝

关注

私信

热门文章

分类专栏

最新评论

多益网络-人工智能与大数据-笔试
Xclearlove7: 兄弟过了10年了还没想清楚放代码
jps命令没有namenode或datanode, 怎么解决？
巴別塔: 用mkdir命令
jps命令没有namenode或datanode, 怎么解决？
sinat_39267125: 一上午了，就你个大兄弟的办法靠谱，
jps命令没有namenode或datanode, 怎么解决？
加油加油!: 我们hadoop集群开启后正常来讲主节点有五个进程的：jps，namenode，datanode，resourcemanager，nodemanager，但是现在没有namenode。其余两个子节点本来也该有四个进程：datanode，jps，secondarynamenode，nodemanager，但是现在没有secondarynamenode。有没有大佬懂得啊!!
jps命令没有namenode或datanode, 怎么解决？
畏迁c: 而且，我看见有很多人都在问logs目录在哪里，嗯，， find / -type d -name "logs" ，可以用这个找找，应该一般都在hadoop下面的logs，也就是可以先cd hadoop-2.7.7(注意自己的版本)，然后cd logs，希望能帮到有需要的人

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。