Zero-shot Learning零样本学习论文阅读（四）——Zero-Shot Recognition using Dual Visual-Semantic Mapping Paths

最新推荐文章于 2023-10-11 19:16:14 发布

River_J777

最新推荐文章于 2023-10-11 19:16:14 发布

阅读量695

点赞数 2

分类专栏： Zero-Shot Learning 文章标签：模式识别机器学习深度学习 ZSL 少样本学习

本文链接：https://blog.csdn.net/river_j777/article/details/111772176

版权

本文介绍了零-shot学习的背景和算法原理，特别是如何解决特征空间与语义空间之间的语义间隔问题。通过流形学习和K近邻方法，调整类别语义表示以匹配样本的流形，从而实现从特征空间到语义空间的有效映射，用于零-shot识别任务。

摘要由CSDN通过智能技术生成

Zero-shot Learning零样本学习论文阅读（四）——Zero-Shot Recognition using Dual Visual-Semantic Mapping Paths

背景
- 流形学习
- 语义间隔(semantic gap)
算法原理

这篇2017年的论文提供了解决semantic gap问题的简单做法，所谓的semantic gap也就是从图片中提取的低层特征到高层语义之间存在的“语义鸿沟”问题。这与上一篇论文提到的领域漂移问题都是zero-shot learning技术瓶颈问题之一。

背景

流形学习

首先，什么是流形？
流形(manifold)是局部具有欧式空间性质的空间，包括各种纬度的曲线曲面，例如球体、弯曲的平面等。流形的局部和欧式空间是同构的。
流形学习（manifold learning）是机器学习、模式识别中的一种方法，在维数约简方面具有广泛的应用。它的主要思想是将高维的数据映射到低维，使该低维的数据能够反映原高维数据的某些本质结构特征。流形学习的前提是有一种假设，即某些高维数据，实际是一种低维的流形结构嵌入在高维空间中。流形学习的目的是将其映射回低维空间中，揭示其本质。

语义间隔(semantic gap)

样本的特征往往是视觉特征，比如用深度网络提取到的特征，而语义表示却是非视觉的，这直接反应到数据上其实就是：样本在特征空间中所构成的流型与语义空间中类别构成的流型是不一致的。而语义间隔问题就是样本在特征空间中的流形与语义空间中的类别构成的流形是有差异的。解决此问题的思路便是将二者的流型调整至一致。

算法原理

算法思路

要解决的问题是将特征空间中的流形与语义空间中的类别构成的流形，最简单的思路便是将类别的语义表示调整到样本的流形，即用类别语义表示的K近邻样本点重新表示类别语义。

符号设定

可见（训练）标签集 $L_{s}=\left\{l_{s}^{1}, l_{s}^{2} \ldots \ldots l_{s}^{m}\right\}$ (共有 $m$ 个类) ，其在语义空间中对应的prototype集为 $K_{s}=\left\{k_{s}^{1}, k_{s}^{2} \ldots \ldots k_{s}^{m}\right\}$ ；
不可见 (测试) 标签集 $L_{u}=\left\{l_{u}^{1}, l_{u}^{2} \ldots \ldots l_{u}^{l}\right\}$

最低0.47元/天解锁文章

River_J777

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Zero-shot Learning零样本学习论文阅读（四）——Zero-Shot Recognition using Dual Visual-Semantic Mapping Paths

Zero-shot Learning零样本学习论文阅读（四）——Zero-Shot Recognition using Dual Visual-Semantic Mapping Paths背景流形学习语义间隔(semantic gap)算法原理算法思路符号设定算法流程这篇2017年的论文提供了解决semantic gap问题的简单做法，所谓的semantic gap也就是从图片中提取的低层特征到高层语义之间存在的“语义鸿沟”问题。这与上一篇论文提到的领域漂移问题都是zero-shot learning技
复制链接

扫一扫