数据处理

最新推荐文章于 2022-01-10 15:14:20 发布

郑小则

最新推荐文章于 2022-01-10 15:14:20 发布

阅读量681

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010743187/article/details/41704205

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1，提升分类准确率

1) 装袋：

书上给的例子是投票，也就是某个分类结果被越多的分类模型所认同（得出），那么这个结果可以认为是正确的划分类。

具体是：由不同的训练集得出不同的分类模型，将未知数X 分类，统计分类模型得出的结果，票数最高的为最后的划分类。即多数表决

2）提升：

总的思想是：

1、给每个训练组赋予一个误分类的权值（表示分类难度？），对于误分类率高的训练组进行多次训练（做难题所能获取的知识通常要比做简单题的还要多）。

2、对于不同分类模型，根据其错误率高低分配一个权值，对于其表决结果乘上其权值再进行决策

3)提高类不平衡数据的分类准确率：

在某些问题，由于我们感兴趣的主类（正类）的元组少于其他类（负类），比如被欺诈的人的个数确实要远低于正常的个数的。这个时候我们采用一下方法：

1、过抽样：复制正类元组，直到与负类达到一定比例

2、欠抽样：减少负类元组，直到与正类达到一定比例

3、阈值移动：设置一个阈值t 对于f(X) >= t 的元组视为正类的，其他元组视为负类

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。