Active Learning主动学习

最新推荐文章于 2025-04-13 20:03:52 发布

小明的梦想

最新推荐文章于 2025-04-13 20:03:52 发布

阅读量1.7k

点赞数

分类专栏：机器学习文章标签： Active Learning

本文链接：https://blog.csdn.net/suoyan1539/article/details/79593901

版权

主动学习是应对有类标签数据稀缺的一种方法，通过让算法选择最具信息量的样本进行人工标注，以提高模型精度。其关键在于找到模型最可能出错的样本。主动学习通常包括初始化和循环查询阶段，不断迭代提升分类器性能。常见的主动学习策略有Uncertainty Sampling、Query-By-Committee和Expected-Error-Reduction。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主动学习（Active Learning）
在某些情况下，没有类标签的数据相当丰富而有类标签的数据相当稀少，并且人工对数据进行标记的成本又相当高昂。在这种情况下，我们可以让学习算法主动地提出要对哪些数据进行标注，之后我们要将这些数据送到砖家那里让他们进行标注，再将这些数据加入到训练样本集中对算法进行训练，提高模型的精确度。这一过程叫做主动学习。

主动学习那些比较难的，信息量大的样本。而这些样本是基于模型预测不确定性而选择的，或者在总体预测发散，这些方法的关键点就是找到当前模型最可能出错的样本，这样在标记和加入到训练数据集之后，模型对于不可见数据上的这些错误变得更加有效而快速。使得更小的子集来达到模型最理想的性能。