主动学习

最新推荐文章于 2022-06-10 08:31:51 发布

Q&Cui

最新推荐文章于 2022-06-10 08:31:51 发布

阅读量277

点赞数

分类专栏：机器学习文章标签：人工智能

本文链接：https://blog.csdn.net/qq_40394960/article/details/111396637

版权

机器学习专栏收录该内容

10 篇文章 1 订阅

订阅专栏

主动学习框架
*主动学习就像学生（分类器）学习一样，专门学习自己不会的（最有价值的未标记样本），然后再通过老师讲解（专家标注），不断提高自己成绩

Active Learning，即主动学习，通过一定的算法查询最有用的未标记样本，并交由专家进行标记，然后用查询到的样本训练分类模型来提高模型的精确度。*

深度学习在各种各样的实际应用中取得巨大突破，其主要的推动力在于三个方面：数据，算法和算力。也就是说，在很多情况下，一个完整的解决方案，需要具备这样的条件：1）足够的符号要求的数据；2）强大机器保障；3）靠谱的算法。随着大数据和GPU技术的发展，很多问题已不在是局限，但取得大量标注准确的数据依然需要高昂的成本，模型的训练依然需要大量的时间和精力，这些也成为当前深度学习的局限。在监督学习方法中，获得有标注数据是异常困难的，主动学习通过对未标注数据进行筛选，可以利用较少的标注样本取得较高的模型学习准确率。

定义

主动学习通过“选择策略”主动从未标注样本集中挑选部分样本，交给相关领域专家进行标注，然后将标注样本增加到训练数据集给“学习模块”进行训练。当学习模块满足终止条件后停止，否则不断重复获得更多的标注样本进行训练。

步骤

主要分为二个部分：学习引擎和选择引擎。其中，学习引擎负责维护一个基准分类器，根据监督学习的方法来对已标注数据进行学习，从而使该分类器的性能提高，选择引擎负责运行样例选择算法来选择一个未标注的样例并交给人类专家来进行标注，然后再将标注后的样例加入已标注样本集中。二个引擎交替工作，经过多次循环，基准分类器的性能逐渐提高，满足某个预设的条件时，整个过程终止。

A=(C,L,S,Q,U) ：其中C为一个或一组分类器；L为一组已标注的训练样本集；Q为查询策略函数，用于在未标注的样本中查询信息量大的样本；U为整个未标注样本集；S为监督者，可以对未标注样本进行标注。