深度学习半自动标注_拯救深度学习:标注数据不足下的深度学习方法

本文探讨了深度学习在标注数据不足的情况下的应对策略,包括半监督/弱监督学习、数据合成、主动学习和自监督学习。通过这些方法,可以减少对大量人工标注数据的依赖,降低数据标注成本,提升模型性能。
摘要由CSDN通过智能技术生成

摘要:解决深度学习对数据的依赖问题和减少数据标注成本成为了业界的研究热点。本文将介绍以下几个研究方向:半监督/弱监督学习、数据合成、主动学习、自监督。

1. 引言

得益于深度学习的发展,许多计算机视觉任务在近几年取得了不错的效果。但是,现有的深度学习算法多是有监督学习算法,依赖大量人工标记的训练数据,而标注数据十分耗费人力成本。因此,解决深度学习对数据的依赖问题和减少数据标注成本成为了业界的研究热点。本文选取了相关领域的部分论文,将介绍以下几个方向:半监督/弱监督学习;数据合成;主动学习;自监督。

2. 半监督/弱监督学习

半监督学习是监督学习和无监督学习相结合的一种学习方法。半监督/弱监督学习使用大量的未标注数据/弱标注数据,同时使用小部分已标注数据,来训练机器学习模型。它预期的结果是通过对大部分未标注数据/弱标注数据的利用,得到的模型优于单纯只用已标注数据训练的模型。弱标注数据的数据标签信息量较少且标注难度小,比如在目标检测任务中,通常需要标注目标的类别和坐标,弱标注数据则只标注出图像中的目标类别,没有坐标信息。

论文[1] 是半监督方向的图像分类论文,实验主要在手写体图像数据集上进行,包括MNIST、CIFAR等,图1是该论文方法的架构。如图所示,图中左上角和左下角分别是未标注数据集U和已标注L,中间的橘红色模块是论文的神经网络,右侧是数据的筛选模块。流程如下:先使用已标注数据集L训练得到初始模型M1,然后使用M1在未标注数据集U上进行推理,U中的每张图像都会得到一个分类结果和对应的置信度S。基于S对U中的样本进行筛选,将分类置信度较高的样本U1和对应的推理结果当作GT&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值