二分类器解决多分类问题

最新推荐文章于 2022-08-05 17:40:35 发布

你吃过卤汁牛肉吗

最新推荐文章于 2022-08-05 17:40:35 发布

阅读量8.1k

点赞数 3

分类专栏：机器学习机器学习基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012370185/article/details/90205231

版权

本文探讨了使用二分类器解决多分类问题的两种策略：one-versus-rest（OvR）和one-versus-one（OvO）。OvR通过训练每个类别的单独分类器来识别样本，存在分类重叠和数据集偏斜问题。而OvO避免了数据集偏斜，但需要训练更多的分类器。为了解决这些问题，文章提出了改进方法，如采用有向无环图（DAG SVM）结构和优化根节点的选择策略，以提高分类效率和准确性。

摘要由CSDN通过智能技术生成

两种思路：

以SVM为例

1.one-versus-rest

思想：

假设一共有1,2,3,4,5个类别的数据

对于第1类，训练一个分类器：第1类是正样本，其余类的样本都是负样本

对于第2类，训练一个分类器：第2类是正样本，其余类的样本都是负样本

以此类推，一共训练出五个分类器

在预测阶段，对于输入的待分类样本，分别从第一个分类器开始询问是否属于该类别，该分类器“承认”，就将该样本判别为该类

存在的问题：

分类重叠现象：某个待分类样本被多个分类器“认领”（可以计算该样本与这些分类器对应超平面的距离，选择距离最远的）

不可分类现象：所有分类器都不“认领“”某个待分类样本（设置一个“其他类，专门用来存放异常类”，容易造成数据集偏斜问题？？？）

ps：这种方式会有数据集偏斜问题（因为是一对多），影响分类面划分的准确性，如下图：

数据集偏斜问题：在

最低0.47元/天解锁文章

你吃过卤汁牛肉吗

关注

3
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。