zero-shot基础入门

最新推荐文章于 2025-04-18 10:50:32 发布

是暮涯啊

最新推荐文章于 2025-04-18 10:50:32 发布

阅读量1.7w

点赞数 21

分类专栏：深度学习文章标签： zero-shot

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/longshaonihaoa/article/details/120674842

版权

深度学习专栏收录该内容

41 篇文章

订阅专栏

这篇博客深入探讨了Zero-Shot Learning的概念，包括其定义、开山之作、图像到语义、语义到图像、生成模型以及其他相关进展。文章通过公式推导和代码实现，解释了如何在没有见过的类别上进行预测，强调了领域适应、特征对齐和类间特征重叠等问题。此外，还介绍了早期数据集和属性到类别矩阵的角色。博客提供了关键的洞察力，适合希望深入理解零样本学习的人工智能研究者和开发者。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

好早前看了一下zero-shot的文章，并进行整理做成了PPT，今天有空分享一下，大家可以互相学习讨论。

每张PPT下都有链接，更详细的介绍可以查看链接。

1、定义

这是zero-shot介绍时常用的一张图，从见过的类别（第一列）中提取特征（如：外形像马、条纹、黑白），然后根据对未知类别特征的描述，测试未见过的类别。

2、开山之作

DAP和IAP可以看一下公式的区别，后来基本都采用IAP方式。y为已知类别标签，a为特征属性，z为未知类别。

由公式可以看出模型主要是预测特征属性，由此引入下面图片写的缺点，属性到类别的改进引出了下图的两篇论文。

另外要说明一下这些早期数据集，是有一个属性到标签的矩阵，比如属性是100个，标签有60个，就有一个100*60的矩阵，代表专家先验知识。

这两张图是《An embarrassingly simple approach to zero-shot learning》的公式推导和代码实现。我建议可以推导一下，很多性质直接用。最后看代码你会发现，公式直接推导出了最优权重，因此不需要训练过程了。这就是命名中超级简单的意思。

3、图像到语义

按我的理解翻译一些人话：

领域漂移这里：我认为是可以当成DA里面的特征对齐

每个类中的样本个体不足以表示类内部的可变性：比如我们定义了虎的原型中有尾巴属性，但是有的虎是正面图，你看不见尾巴，那我们定义的原型就无法表示现在这只虎了。

帮助消除类间相重叠特征所带来的歧义：比如斑马和猪都有尾巴属性，他们就是重叠的特征，但是网络分不出来这俩尾巴的区别。

介绍一下Lb，这里我想了好久，我觉得pi是判断属于未见的类还是已见的类。比如图中的狗，此时没有对应狗的标签，网络预测它属于未见类，这个信息是可以提供的。

4、语义到图像

5、生成模型

6、其他

后面cv发展起来后的工作看网络图基本就可以理解，最后这个蛮好玩的，有兴趣可以测试代码跑一跑。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。