小样本学习最新综述

最新推荐文章于 2024-06-22 13:03:17 发布

我爱计算机视觉

最新推荐文章于 2024-06-22 13:03:17 发布

阅读量4.8k

点赞数 4

本文转载自机器之心。

什么是小样本学习？它与弱监督学习等问题有何差异？其核心问题是什么？来自港科大和第四范式的这篇综述论文提供了解答。

数据是机器学习领域的重要资源，在数据缺少的情况下如何训练模型呢？小样本学习是其中一个解决方案。来自香港科技大学和第四范式的研究人员综述了该领域的研究发展，并提出了未来的研究方向。

这篇综述论文已被 ACM Computing Surveys 接收，作者还建立了 GitHub repo，用于更新该领域的发展。

论文地址：https://arxiv.org/pdf/1904.05046.pdf
GitHub 地址：https://github.com/tata1661/FewShotPapers

机器学习在数据密集型应用中取得了很大成功，但在面临小数据集的情况下往往捉襟见肘。近期出现的小样本学习（Few-Shot Learning，FSL）方法旨在解决该问题。FSL 利用先验知识，能够快速泛化至仅包含少量具备监督信息的样本的新任务中。

这篇论文对 FSL 方法进行了综述。首先，该论文给出了 FSL 的正式定义，并厘清了它与相关机器学习问题（弱监督学习、不平衡学习、迁移学习和元学习）的关联和差异。然后指出 FSL 的核心问题，即经验风险最小化方法不可靠。

基于各个方法利用先验知识处理核心问题的方式，该研究将 FSL 方法分为三大类：

数据：利用先验知识增强监督信号；
模型：利用先验知识缩小假设空间的大小；
算法：利用先验知识更改给定假设空间中对最优假设的搜索。

最后，这篇文章提出了 FSL 的未来研究方向：FSL 问题设置、技术、应用和理论。

论文概览

该综述论文所覆盖的主题见下图：

我们选取介绍了该综述论文中的部分内容，详情参见原论文。

什么是小样本学习？

FSL 是机器学习的子领域。

我们先来看机器学习的定义：

计算机程序基于与任务 T 相关的经验 E 学习，并得到性能改进（性能度量指标为 P）。

基于此，该研究将 FSL 定义为：

小样本学习是一类机器学习问题，其经验 E 中仅包含有限数量的监督信息。

下图对比了具备充足训练样本和少量训练样本的学习算法：

FSL 方法分类

根据先验知识的利用方式，FSL 方法可分为三类：

FSL 方法解决少样本问题的不同角度。

基于此，该研究将现有的 FSL 方法纳入此框架，得到如下分类体系：

数据

此类 FSL 方法利用先验知识增强数据 D_train，从而扩充监督信息，利用充足数据来实现可靠的经验风险最小化。

如上图所示，根据增强数据的来源，这类 FSL 方法可分为以下三个类别：

模型

基于所用先验知识的类型，这类方法可分为如下四个类别：

算法

根据先验知识对搜索策略的影响，此类方法可分为三个类别：

文章最后从问题设置、技术、应用和理论四个层面探讨了小样本学习领域的未来发展方向。

END

备注：小样本

小样本零样本域适应交流群

小样本学习、零样本学习、域适应等技术，

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看，让更多人看到

我爱计算机视觉

关注

4
点赞
踩
72

收藏

觉得还不错? 一键收藏
0
评论
小样本学习最新综述

本文转载自机器之心。什么是小样本学习？它与弱监督学习等问题有何差异？其核心问题是什么？来自港科大和第四范式的这篇综述论文提供了解答。数据是机器学习领域的重要资源，在数据缺少的情况下如何训...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。