主动学习-主动学习算法综述

最新推荐文章于 2024-06-05 16:23:13 发布

Emma-Zhang

最新推荐文章于 2024-06-05 16:23:13 发布

阅读量3.3k

点赞数 4

分类专栏：机器学习与Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/it_is_me_a/article/details/103477074

版权

机器学习与Python 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

参考文献：主动学习算法综述

主动学习（Active Learning）

用于解决分类问题的机器学习，如今已经是很熟悉的话题了，我们知道所有分类模型都需使用标记样本训练，并且分类模型的效果依赖于标记样本的质量。一个好的分类模型离不开大量优质的训练数据，但是在实际应用条件下，我们得到的数据往往都是没有经过处理的，而数据的处理是一项相当庞大且繁琐的工作，并且有时候还需要一些专业人士才能处理，因此需要耗费巨大的人力成本和时间成本。基于此，在机器学习领域中，提出主动学习方法，优化分类模型。

主动学习算法会通过某些方法找到样本数据中最有价值的数据，然后我们把删选出来的数据交由专家进行人工标注后，将标注后的数据放入训练集对分类模型进行迭代优化训练，这一过程称为主动学习

简单来说，机器学习中的主动学习能够用更少的人工成本获取更有价值的标记样本从而使分类器具有更好的泛化性能。和以往被动学习算法不同的是，主动学习算法会根据某一些策略将未标记样本中的一部分样本进行标记，然后重新投入训练集中，用来辅助分类器的训练。

主动学习算法可以有以下五个组件进行建模：

A = (C, L, S, Q, U)

其中C为一个或一组分类器；L为一组已标注的训练集样本；Q为查询函数，用于在未标注的样本中查询信息量大的样本；U为整个未标注样本集；S为督导者，可以对未标注样本进行标注。

主动学习算法主要分为两阶段：

第一阶段为初始化阶段，随机从未标注样本中选取一部分作为训练集并由督导者标注，用来建立初始分类器模型；

第二阶段为循环查询阶段，监督者从未标注样本集U 中，按照某种查询标准 Q ，选取一定的未标注样本进行标注，并加到训练集 L 中，重新训练分类器，直到达到训练停止标准为止。

主动学习算法是一个迭代的过程，分类器使用迭代时反馈的样本进行训练，不断提升分类效率。

在这里插入图片描述

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
主动学习-主动学习算法综述

参考文献：主动学习算法综述主动学习（Active Learning）用于解决分类问题的机器学习，如今已经是很熟悉的话题了，我们知道所有分类模型都需使用标记样本训练，并且分类模型的效果依赖于标记样本的质量。一个好的分类模型离不开大量优质的训练数据，但是在实际应用条件下，我们得到的数据往往都是没有经过处理的，而数据的处理是一项相当庞大且繁琐的工作，并且有时候还需要一些专业人士才能处理，因此需要耗费...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。