多分类方法

你的凡王

已于 2024-05-22 02:46:30 修改

阅读量119

点赞数 3

文章标签：分类数据挖掘人工智能

于 2024-05-18 22:54:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_65325092/article/details/139032873

版权

SVM、logistic回归等方法都能进行二分类任务，我们可以直接利用这些方法进行多分类，思路是先将问题进行拆解，变成若干个二分类任务，对每个二分类任务进行学习，再将预测结果集成获得多分类结果。拆解方式可以分为一对一、一对其余、多对多三种。

一对一(OvO)：

假设因变量共有N类，在其中任取两个类则共有

$C_N^2=\frac{A_N^2}{A_2^2}=\frac{N(N-1)}{2}$

种组合，对每个组合训练出二分类分类器，并给出预测值，最后对C_N^2个预测结果看哪一个类被预测的次数最多，将其选为最终分类结果。

一对其余(OvR)：

假设因变量共有N类，任取其中一个作为+1类，其余N-1个类合并统称为-1类，因此需要训练N个二分类分类器，最后产生N个预测结果，若其中仅有一个为+1类则此+1类的类就是预测结果，若有多个+1类则将它们中预测置信度最高者选为预测结果。

多对多(MvM)：

最常用的技术叫做纠错输出码(ECOC)，假设因变量有C_1, ..., C_N共N个类，我们取M个(即编码长度为M)二分类分类器f_1, ..., f_M，任意f_j将N个类中的一部分(大于等于1小于N个)作为+1类，剩余作为-1类，这样任意C_i都得到了长度为M的编码。使用M个二分类器得到长度为M的预测值编码，然后计算预测值编码和C_1, ..., C_N的编码的距离，距离最小的类C_min就是预测分类。

注意除了+1和-1这种编码方式叫做二元码，除此之外还有三元码，即+1, -1和0，0表示停用类。

ECOC对分类器的错误有一定容忍和修正能力，少数分类器预测出错仍有可能得到正确的最终分类。对同一个任务，ECOC编码越长纠错能力越强，计算和存储代价也越大，此外有限的类别数可能得组合数是有限的，编码长度超过一定范围就失去了意义。

对同等长度的编码，任意两个类别之间的编码距离越远则纠错能力越强，码长较小时可按此原则设计出最优编码，但是实践中非最优的编码也能产生足够好的分类器。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
多分类方法

SVM、logistic回归等方法都能进行二分类任务，我们可以直接利用这些方法进行多分类，思路是先将问题进行拆解，变成若干个二分类任务，对每个二分类任务进行学习，再将预测结果集成获得多分类结果。
复制链接

扫一扫

你的凡王 CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

117万+: 周排名

7万+: 总排名

6716: 访问

: 等级

343: 积分

88: 粉丝

143: 获赞

3: 评论

85: 收藏

私信

关注

热门文章

最新评论

XGBoost
CSDN-Ada助手: 恭喜您发布了关于XGBoost的第9篇博客！您的持续创作精神令人钦佩，相信您的专业知识会为更多人带来帮助和启发。建议您在接下来的创作中，可以深入探讨XGBoost的应用场景和优化技巧，或者结合实际案例进行分析，让读者更易于理解和应用。期待您更多精彩的文章，加油！
决策树
CSDN-Ada助手: 恭喜您撰写了关于决策树算法的博客！不断分享知识和经验对于自己的成长和他人的帮助都是非常有益的。接下来，我建议您可以尝试探讨一下决策树算法在不同领域的应用案例，或者是与其他机器学习算法的比较和结合运用等方面的内容。期待您更多精彩的创作！
分类方法中的类别不平衡问题
CSDN-Ada助手: 恭喜用户在第6篇博客中探讨了分类方法中的类别不平衡问题！这是一个非常重要且复杂的主题，您的深入分析让读者受益匪浅。接下来，我建议您可以尝试探讨一些应对类别不平衡问题的解决方案，比如过采样、欠采样或者集成学习等方法，这将进一步丰富您的博客内容。期待您更多精彩的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。