二分类器解决多分类问题

本文探讨了使用二分类器解决多分类问题的两种策略:one-versus-rest(OvR)和one-versus-one(OvO)。OvR通过训练每个类别的单独分类器来识别样本,存在分类重叠和数据集偏斜问题。而OvO避免了数据集偏斜,但需要训练更多的分类器。为了解决这些问题,文章提出了改进方法,如采用有向无环图(DAG SVM)结构和优化根节点的选择策略,以提高分类效率和准确性。
摘要由CSDN通过智能技术生成

两种思路:

以SVM为例

1.one-versus-rest

思想:

假设一共有1,2,3,4,5个类别的数据

对于第1类,训练一个分类器:第1类是正样本,其余类的样本都是负样本

对于第2类,训练一个分类器:第2类是正样本,其余类的样本都是负样本

以此类推,一共训练出五个分类器

在预测阶段,对于输入的待分类样本,分别从第一个分类器开始询问是否属于该类别,该分类器“承认”,就将该样本判别为该类

存在的问题:

分类重叠现象:某个待分类样本被多个分类器“认领”(可以计算该样本与这些分类器对应超平面的距离,选择距离最远的)

不可分类现象:所有分类器都不“认领“”某个待分类样本(设置一个“其他类,专门用来存放异常类”,容易造成数据集偏斜问题???)

ps:这种方式会有数据集偏斜问题(因为是一对多),影响分类面划分的准确性,如下图:

数据集偏斜问题:在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值