多分类学习（OvO、OVR、MVM 原理区别）

cy^2

已于 2023-02-16 21:13:05 修改

阅读量4.6k

点赞数 6

分类专栏：机器学习

于 2022-03-20 20:14:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34120015/article/details/123618901

版权

本文介绍了多分类问题的解决策略，包括OvO（一对一）、OvR（一对剩余）和MvM（多对多）策略。OvO拆分数据进行两两组合，训练多个分类器，预测时采用投票法。OvR将一类作为正例，其他为反例，只有一个分类器将其预测为正例则属于该类。MvM则更为复杂，采用ECOC技术，通过编码距离判断类别，通常效果优于OvR。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

多分类问题解决思路，一般来说，用二分类学习器解决多分类问题，基本思想是先拆分后集成，也就是先将数据集进行拆分，然后多个数据集可训练多个模型，然后再对多个模型进行集成。这里所谓集成，指的是使用这多个模型对后续新进来数据的预测方法。

具体来看，依据该思路一般有三种实现策略，分别是“一对一”（One vs Ons，简称OvO）、“一对剩余”（One vs Rest，简称OvR）和“多对多”（Many vs Many，加成MvM）。接下来我们逐个讨论。

1.OvO策略

拆分策略

OvO的拆分策略比较简单，基本过程是将每个类别对应数据集单独拆分成一个子数据集，然后令其两两组合，再来进行模型训练。例如，对于上述四分类数据集，根据标签类别可将其拆分成四个数据集，然后再进行两两组合，总共有6种组合，也就是 $C^2_4$ 种组合。拆分过程如下所示：

然后在这6个新和成的数据集上，我们就能训练6个分类器。当然，如果是N分类问题，则需要训练 $C^2_N=\frac{N(N-1)}{2}$

最低0.47元/天解锁文章

博客等级

码龄9年

60
原创

94
点赞

579
收藏

19
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

特征变换：特征归一化（Normalization）作用以及方法 Min-Max、Z-Score
DW_DROME: 有道理
presto中array_join vs mysql中group_concat
weixin_47960115: 应该为 ,array_join(array_distinct(array_agg(label)), ',') as "label_list"
4、特征选择(filter)：卡方检验特征筛选
赛可乐: 对于连续变量与离散变量的分析很有帮助，谢谢
4、特征选择(filter)：卡方检验特征筛选
火桑依旧: 0类标签0.7，1类标签0.3，结果0类特征行数55行，1类特征行数45行，你真是给我逗笑了
特征变换：特征归一化（Normalization）作用以及方法 Min-Max、Z-Score
求求你们别复制粘贴了: 一个错误：零均值归一化，要求经过处理的数据符合标准正态分布，这句话是错误的。1.减去均值除以标准差，只能是得到均值是0，方差是1的分布，但不是正态分布。2.任何一堆数据都可以进行如上操作，这些操作并不会对原数据的分布构成影响，（只不过是平移+缩放）其次，挺反感这些命名的。minmax得到的是[0,1]的数据，叫归一化没问题，零均值只是得到了均值为0方差为1，数据值照样可以不落在【-1，1】凭啥叫归一化？还有一种除以范数的保证的是各维度1范数和2范数的和是1，人家叫作标准化叫做归一化不也可以么？英文都叫做normalization，国人硬生生自己把一个单词分为归一、标准、单位化，自己给自己找罪受。要我说，这些操作都叫做标准化操作，只不过是最后得到的结果是不同的标准

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。