机器学习--分类算法中单标签与多标签的问题

最新推荐文章于 2023-04-03 15:56:39 发布

我是疯子喽

最新推荐文章于 2023-04-03 15:56:39 发布

阅读量2.6k

点赞数 1

文章标签：机器学习数据挖掘分类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35733800/article/details/105281573

版权

本文探讨了机器学习中的单标签和多标签分类问题。在单标签问题中，介绍了OVO、OVR和ECOC三种策略。在多标签问题中，讨论了转换策略中的Binary Relevance、Classifier Chains和Calibrated Label Ranking，以及算法适应方法。这些方法针对不同类型的多标签问题，考虑了标签间的依赖关系和效率问题。

摘要由CSDN通过智能技术生成

目录

一单标签问题（二分类算法进行预测单标签多分类）

1 ovo（one versus one，一对一）

2 ovr（one versus rest，一对多）

3 error correcting output codes（纠错码机制，多对多）

二多标签问题（分类算法预测多标签问题）

1 转换策略（Problem Transform Methods）

1）Binary Relevance（first-order）

2）Classifier Chains（high-order）

3）Calibrated Label Ranking（second-order）

2 算法适应（Algorithm Adaption）

注意：正例记作1，负例记作-1

一单标签问题（二分类算法进行预测单标签多分类）

1 ovo（one versus one，一对一）

第一步：将k个类别的样本，进行两两类别样本组合，产生个训练数据子集

第二步：使用组合之后的数据子集训练模型，产生个训练模型

第三步：将分类器进行融合，采用多数投票法，产生预测值

2 ovr（one versus rest，一对多）

第一步：将第一个类别作为正例，其他所有类别作为负例，依次遍历剩下类别样本，从而产生k个数据子集

第二步：对每个数据子集训练模型，产生k个训练模型

第三步：将分类器进行融合

当只有一个正例输出的时候，该正例对应的类别，即为当前样本类别
当有多个正例输出的时候，根据分类器的置信度指标，选择最大置信度指标的正例输出，作为当前样本类别

注意：

置信度：常常使用精确率或者召回率，但是一般选择输出最大值作为置信度标准

3 error correcting output codes（纠错码机制，多对多）

第一步：编码阶段（训练阶段）

对k个类别数据，进行M次划分，产生M个数据子集，且每一次划分，将一部分数据作为正例，另一部分作为负例
对每个数据子集进行训练模型，产生M个模型
每个分类器模型预测值都对应空间上一个点

第二步：解码阶段（预测阶段）

将测试样本对应的点和类别对应的点求欧式距离
选择距离最小值对应的类别，作为预测值

注意：如图所示，M=5

二多标签问题（分类算法预测多标签问题）

注意：根据多标签业务的复杂性，可以分为两大类型

第一种类型：多标签之间不存在依赖关系
第二种类型：多标签之间存在依赖关系

1

最低0.47元/天解锁文章

我是疯子喽

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。