深度学习：zero-shot-learning（一）SCore_cvpr2017

最新推荐文章于 2023-11-22 20:49:06 发布

VIP文章 work_coder

最新推荐文章于 2023-11-22 20:49:06 发布

阅读量1.9k

点赞数 3

本文链接：https://blog.csdn.net/weixin_41108334/article/details/82025249

版权

1 知乎：https://zhuanlan.zhihu.com/p/34656727

2 https://zhuanlan.zhihu.com/p/27661503

3 http://www.mamicode.com/info-detail-2243153.html

一、Zero-Shot learning

在传统的分类模型中，为了解决多分类问题（例如三个类别：猫、狗和猪），就需要提供大量的猫、狗和猪的图片用以模型训练，然后给定一张新的图片，就能判定属于猫、狗或猪的其中哪一类。但是对于之前训练图片未出现的类别（例如牛），这个模型便无法将牛识别出来，而ZSL就是为了解决这种问题。在ZSL中，某一类别在训练样本中未出现，但是我们知道这个类别的特征，然后通过语料知识库，便可以将这个类别识别出来。

zero-shot learning的一个重要理论基础就是利用高维语义特征代替样本的低维特征，使得训练出来的模型具有迁移性。语义向量就是高维语义特征，比如一个物体的高维语义为“四条腿，有尾巴，会汪汪叫，宠物的一种”，那我们就可以判断它是狗，高维语义对它没有细节描述，但是能够很好的对其分类，分类是我们的目的，所以可以舍去低维特征，不需要“全面”。

二、DAP模型

《Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer》

DAP可以理解为一个三层模型：第一层是原始输入层，例如一张电子图片（可以用像素的方式进行描述）；第二层是p维特征空间，每一维代表一个特征（例如是否有尾巴、是否有毛等等）；第三层是输出层，输出模型对输出样本的类别判断。在第一层和第二层中间，训练p个分类器，用于对一张图片判断是否符合p维特征空间各个维度所对应的特征；在第二层和第三层间，有一个语料知识库，用于保存p维特征空间和输出y的对应关系，这个语料知识库是事先认为设定的（暂时理解是这样？）。

假设我们已经训练好了一个DAP模型，第一层和第二层间的分类器可以判断 是否黑眼圈、是否喜欢吃竹子 之类的特征，然后在语料知识库里面包含一个映射：黑眼圈喜欢吃竹子--> 熊猫，那么即使我们的模型在训练时没有见过熊猫的图片，在遇到熊猫的图片时，我们可以直接通过对图片的特征进行分析，然后结合知识语料库判断出这张图片是熊猫。假设即使语料知识库里面不包含 黑眼圈喜欢吃竹子--> 熊猫 的映射，我们也可以通过计算熊猫图片的特征与其他训练样本的特征的汉明距离度量，得到熊猫和什么动物比较类似的信息。整个DAP的运作思想就是类似于上述过程。

缺点：

算法引入了中间层，核心在于尽可能得判定好每幅图像所对应的特征，而不是直接去预测出类别；因此DAP模型在判定属性时可能会做得很好，但是在预测类别时却不一定；
无法利用新的样本逐步改善分类器的功能；
无法利用额外的属性信息（如Wordnet等)

三、ALE模型

《Label-Embedding for Att

最低0.47元/天解锁文章

work_coder

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
深度学习：zero-shot-learning（一）SCore_cvpr2017

1 知乎：https://zhuanlan.zhihu.com/p/346567272 https://zhuanlan.zhihu.com/p/276615033 http://www.mamicode.com/info-detail-2243153.html一、Zero-Shot learning在传统的分类模型中，为了解决多分类问题（例如三个类别：猫、狗和猪），就需要提供大...
复制链接

扫一扫