主动学习-主动学习算法综述

参考文献:主动学习算法综述

主动学习(Active Learning)

用于解决分类问题的机器学习,如今已经是很熟悉的话题了,我们知道所有分类模型都需使用标记样本训练,并且分类模型的效果依赖于标记样本的质量。一个好的分类模型离不开大量优质的训练数据,但是在实际应用条件下,我们得到的数据往往都是没有经过处理的,而数据的处理是一项相当庞大且繁琐的工作,并且有时候还需要一些专业人士才能处理,因此需要耗费巨大的人力成本和时间成本。基于此,在机器学习领域中,提出主动学习方法,优化分类模型。

主动学习算法会通过某些方法找到样本数据中最有价值的数据,然后我们把删选出来的数据交由专家进行人工标注后,将标注后的数据放入训练集对分类模型进行迭代优化训练,这一过程称为主动学习

简单来说,机器学习中的主动学习能够用更少的人工成本获取更有价值的标记样本从而使分类器具有更好的泛化性能。和以往被动学习算法不同的是,主动学习算法会根据某一些策略将未标记样本中的一部分样本进行标记,然后重新投入训练集中,用来辅助分类器的训练。

主动学习算法可以有以下五个组件进行建模:

A = (C, L, S, Q, U)

其中C为一个或一组分类器;L为一组已标注的训练集样本;Q为查询函数,用于在未标注的样本中查询信息量大的样本;U为整个未标注样本集;S为督导者,可以对未标注样本进行标注。

主动学习算法主要分为两阶段:

第一阶段为初始化阶段,随机从未标注样本中选取一部分作为训练集并由督导者标注, 用来建立初始分类器模型;

第二阶段为循环查询阶段,监督者从未标注样本集U 中,按照某种查询标准 Q ,选取一定的未标注样本进行标注,并加到训练集 L 中,重新训练分类器,直到达到训练停止标准为止。

主动学习算法是一个迭代的过程,分类器使用迭代时反馈的样本进行训练,不断提升分类效率。

在这里插入图片描述

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值