主动学习综述(ACTIVE LEARNING)

最新推荐文章于 2024-06-05 16:23:13 发布

weixin_34179762

最新推荐文章于 2024-06-05 16:23:13 发布

阅读量1k

点赞数

文章标签： python 数据结构与算法

原文链接：https://my.oschina.net/u/1240964/blog/799233

版权

Active learning process

算法：主动学习算法伪代码描述

输入：未标记样本U,标记样本集L,学习引擎LE,采样引擎SE

输出：学习引擎SE

BeginFor：i=1,2,…,N

Train(LE,L); //通过标记样本集L训练分类器f

T=Test(LE,U);

S=Select(SE,U);

Label(S) ; //对集合S中的样本进行标记

L<—L + S

U<—U - S

Until 迭代次数达到某阈值，或达到其他终止条件

Active Learning

Membership Query Synthesis

实验者可以选择询问输入空间中任何一个未标识的实例，包括实验者自己创建的，而不仅仅是来自某个自然分布的实例。好的询问关系经常是易处理的或者在有限的领域内是有效的。

Stream-Based Selective Sampling

基于不确定度缩减的方法

基准分类器选择最不能确定其分类的实例进行标识，这种方法以信息熵作为衡量样例所含信息量大小的度量。从几何角度看这种方法优先选择靠近分类边界的实例，又称为最近边界法。

基于版本空间缩减的方法

基于泛化误差缩减的方法

选择能够是未来泛化误差最大程度缩小的实例。
首先选择一种损失函数用于估计未来错误率，然后将未标识实例集中的每一个实例都作为下一个可能的选择，分别估计其能给基准分类器带来的误差缩减，选择估计误差缩减最大的那个实例进行标识。

Uncertainty Sampling

Query-By-Committee

委员会询问选择算法不直接计算分类误差，而是根据自己已标识实例集训练两个或多个分类器，组成“委员会”，利用委员会对未标识实例进行标识投票，然后选择询问投票最不一致的实例。
计算简单，评价未标识实例，只需要一次内积运算。

Expected Model Change

THREE METHODS

转载于:https://my.oschina.net/u/1240964/blog/799233

关注