主动学习概括

最新推荐文章于 2022-03-17 00:11:59 发布

亦万

最新推荐文章于 2022-03-17 00:11:59 发布

阅读量321

点赞数 1

分类专栏：主动学习（Active Learning）文章标签： Active learning 主动学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GrinAndBearIt/article/details/107447026

版权

主动学习（Active Learning）专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、背景

在日常算法工程师工作（特别是风控领域）中可能存在大量未标注的数据集（一般都可以在日志中捞出来），但是某些工作需求历史积累的标注数据集比较少。那么如何使算法工程师不变成标注工程师是目前需要解决的问题。

如果直接对未标注数据集进行人工标注存在下面问题：

某些领域的标注数据集需要专业的知识
成本也比较高
大量数据集标注需要更多的时间

在标注成本和人力不足的情况下，主动学习可以说是对算法工程师很友善的方向了。

二、 Actice Learning

流程

如下图所示，主动学习是一个不断迭代的过程

（1）首先通过已有的标注数据训练模型，或者通过迁移学习得到的模型

（2）通过某些策略挑选出有价值的样本进行标注

（3）放入模型中重新或者增量训练

（4）重复（2）、（3）

挑选样本的策略

（1)基于未标注样本池的主动学习策略

根据预测结果计算信息熵、SVM作为分类器

（2)批量式主动学习方法，侧重于组合式策略以及引入聚类算法的主动学习方法;

（3)半监督主动学习方法;

（4)结合生成对抗网络的主动学习方法

三、效果

博文中作者对1）MNIST；2）Cifar-10；3）Dog-Cat from Kaggle 进行Active learning的实验，实验结果如下：

通过上图可以发现引入active learning后，可以使用更少的数据集达到更好的效果

文中部分内容引用：

https://blog.csdn.net/Houchaoqun_XMU/article/details/80146710

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。