小样本学习(Few-Shot Learning)

如果您的智能手机需要拥有数千张您的照片才能识别您并解锁,这恐怕不尽人意。 在这种情况下,小样本学习或单样本学习是机器学习中的一个热门话题,它们的模型会根据一些训练示例进行预测。


1、什么是小样本学习?

小样本学习(FSL),也称为低样本学习(LSL),是一种机器学习方法,它会训练包含有限信息的数据集。

机器学习应用领域的常见做法是提供可以接收尽可能多数据的模型。 这是因为在大多数机器学习应用程序中,提供更多数据使模型能够更好地预测。 然而,小样本学习旨在用较少的训练数据构建准确的机器学习模型。 由于输入数据的维度是决定资源成本(例如时间成本、计算成本等)的因素,因此人们可以通过使用小样本学习来降低数据分析/机器学习(ML)成本。

2、为什么小样本学习如此重要?

  • 像人一样地测试学习数据:人们可以在看到几个例子后发现手写字符之间的差异。然而,计算机需要大量数据来对它们“看到”的内容进行分类,并找出手写字符之间的差异。小样本学习是一个测试基础,计算机有望从人类等少数例子中学习。
  • 罕见情况学习:通过使用小样本学习,机器可以学习罕见情况。例如,在对动物图像进行分类时,使用小样本学习技术训练的机器学习模型可以在接触少量先验信息后正确分类稀有物种的图像。
  • 减少数据收集工作和计算成本:由于小样本学习需要较少的数据来训练模型,因此消除了与数据收集和标记相关的高成本。训练数据量少意味着训练数据集中的维数低,可以显着降低计算成本。

3、小样本学习应用在哪些领域?

  1. 计算机视觉:计算机视觉探索计算机如何从数字图像或视频中获得高级理解。少样本学习主要用于计算机视觉中,用于处理以下问题。
  • 字符识别
  • 图像分类
  • 物体识别
  • 手势识别
其他对象相关应用:
  • 对象跟踪
  • 零件标签
其他图像应用:
  • 图像检索
  • 图像生成
  • 图片说明
  • 场景位置识别
  • 3D 对象的形状视图重建
视频应用
  • 视频分类
  • 运动预测
  • 动作本地化
  • 人员重新识别
  • 事件检测

2. 自然语言处理 (NLP):Few-shot learning 使自然语言处理 (NLP) 应用程序能够使用少量文本数据示例完成任务。

  • 解析
  • 翻译
  • 短语完善
  • 快速情绪分类
  • 用户意图分类的图表系统
  • 刑事指控预测
  • 单词相似性
  • 文本分类

3. 音频处理:包含有关语音/声音信息的数据可以通过声学信号处理进行分析,并且小样本学习可以实现以下任务的部署。

  • 从用户的一些音频样本中克隆语音
  • 从一个用户到另一个用户的语音转换
  • 跨语言的语音转换

4. 机器人化:为了让机器人表现得更像人类,它们应该能够从一些演示中概括信息。因此,小样本学习在训练机器人完成某些任务方面起着至关重要的作用。

  • 通过模仿单个演示来学习动作
  • 从一些演示中学习操作动作
  • 视觉导航
  • 连续控制

5. 卫生保健:

  • 小样本药物发现
  • COVID-19 诊断

6. 其他应用:

  • 物联网分析
  • 曲线拟合
  • 逻辑推理

4、小样本学习的原理是什么?

小样本学习(FSL)可以被认为是一个元学习模型问题,该模型学习如何学习解决给定的问题。

我们以一个图像分类问题为例:

  • 该模型输入了一些不同类别的示例图像(称为 N-way-K-shot 分类),并使用不同的图像重复解决此任务。
  • 例如,上图显示了一个 3-way-2-shot 分类问题,其中每个任务涉及支持集中 3 种不同动物的 2 张图片,模型尝试对查询集中的图像进行分类。
  • 该模型通过每个不相关的任务提高了对动物进行分类以正确分类的准确性。
  • 然后在一组不同的分类任务上测试模型的性能。

5、小样本学习和零样本学习有哪些不同之处?

小样本学习旨在让 ML 模型在训练数据集中有少量示例可用时预测正确的实例类别。零样本学习旨在预测正确的类,而不暴露于训练数据集中属于该类的任何实例。零样本学习和小样本学习具有共同的应用,例如:

  • 图像分类
  • 语义分割
  • 图像生成
  • 物体检测
  • 自然语言处理

最后,还有单样本学习,它经常与零样本学习混合使用。单样本学习是一种特殊类型的小样本学习问题,其目的是从一个训练样本/图像中学习有关对象类别的信息。智能手机使用的人脸识别技术就是单样本学习问题的一个例子。

 




小样本学习(Few-Shot Learning) - 知乎 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
小样本学习是指在具有非常有限的样本数的情况下进行学习和分类任务的一种机器学习方法。在传统的机器学习算法中,通常需要大量的样本来训练模型,以便对新的样本进行准确的分类。然而,在现实生活中,获得大量样本是非常昂贵和困难的,因此需要一种能够有效利用有限样本的学习方法。 小样本学习的主要挑战是如何在缺少大量标记样本的情况下进行模型训练和泛化。为了解决这个问题,研究人员提出了许多不同的方法。其中一种主流的方法是使用元学习(meta-learning),它通过从一系列相关任务中进行学习,来提高在新任务上的性能。这种方法可以将已有的知识迁移到新任务上,而无需大量样本。 另一种常用的方法是基于生成模型的方法,它通过生成新的样本来扩充训练集。这些生成的样本可以从现有样本中学习到数据的分布规律,从而提高模型的泛化能力。 此外,还有一些其他的小样本学习方法,如基于度量学习的方法、基于关系学习的方法等。这些方法都试图通过学习样本之间的相似性或关系来提高模型的学习能力。 总而言之,小样本学习是一种在样本稀缺的情况下进行机器学习和分类任务的方法。通过使用元学习、生成模型、度量学习以及关系学习等方法,小样本学习可以有效地利用有限的样本来提高模型的性能和泛化能力,为实际应用中的样本稀缺问题提供了解决方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值