Zero-shot Learning零样本学习论文阅读（二）——An embarrassingly simple approach to zero-shot learning

最新推荐文章于 2023-07-02 19:03:41 发布

River_J777

最新推荐文章于 2023-07-02 19:03:41 发布

阅读量1.4k

点赞数 3

分类专栏： Zero-Shot Learning 文章标签：机器学习 python 深度学习人工智能算法

本文链接：https://blog.csdn.net/river_j777/article/details/111559604

版权

本文介绍了ESZSL（Embarrassingly Simple Zero-Shot Learning）算法，它通过添加属性空间并建立映射V来连接特征空间和标签空间。算法使用线性分类器如岭回归，结合损失函数和正则化项优化模型。通过约束保证签名在特征空间的欧几里得范数相似，提高泛化能力。

摘要由CSDN通过智能技术生成

Zero-shot Learning零样本学习论文阅读（二）——An embarrassingly simple approach to zero-shot learning

ESZSL算法概况
- 背景
- 前提
- 思路
算法原理
参考文献

这篇论文提出了一种新的zero-shot learning方法“Embarrassingly simple Zero-Shot Learning”，后来被简写作EsZSL。之所以叫做“embarrassingly simple”，是因为这种新方法只需要一行代码就可以实现，而且在zero-shot learning的几个标准数据集上的表现要优于当时最先进的方法。

ESZSL算法概况

背景

在本篇论文之前zero-shot learning相关的文章更多关注点是attribute learning，从训练实例中提取标签属性，直至《Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer》首次定义了Zero-shot learning并且提出了DAP、IAP，尽管DAP这种方法在一些方面得到应用和进一步研究，但是其弊端也比较明显，主要体现在两方面，一方面是他无法对输出的预测给出可靠性度量，二是算法做出了一些过强的假设，尤其是“各属性之间条件独立”，比如“是否生活在陆地”“是否生活在农场”这两个属性显然不是互相独立的。

前提

假设一共有z个类，其中每个类对应于属性空间中的a维属性向量，称为某个类的signature；集合的所有类用矩阵表示就是属性空间 $\in [ 0,1 ] ^{a\times z}$ ；有m个实例，维度为d维，写成矩阵形式 $\in R^{d\times m}$ ，实例的标签 $Y=\{-1,1\}^{m\times z}$ .

思路

在实例空间X和和标签空间Y中间添加一个属性空间，并且通过一个新的映射 $V$ 连接属性空间和特征空间，最后建立损失函数.

算法原理

模型

从一个一般的线性分类器的原理开始，以岭回归为例，其优化过程就是：
$min_wL(X^TW,Y)+\Omega(W)$
其中 $L$ 为损失函数， $\Omega$ 为正则化项.
为了实现zero-shot learning，中间添加一个属性空间 $S$ ，通过映射 $V$ 连接属性空间 $S$ 和特征空间 $X$ ，即
$\quad V \in R^{d \times a}$
那么上式就变为
$\min _{V} L\left(X^{\top} V S, Y\right)+\Omega(V)$
通过学习得到参数 $V$ 后，输入新的 $x$ 和 $S^*$ ，就可以根据 $argmax_i\quad x^TVS^*_{\cdot ,i}$ 确定预测的类别。

求解

上面得到的式子
$\min _{V} L\left(X^{\top} V S, Y\right)+\Omega(V)$
由两部分组成，一部分是损失函数 $L$ ，另一部分是正则化 $\Omega$ .

损失函数 $L$

损失函数 $L$ 论文中直接定义为Frobenius范数的形式： $L(P, Y)=\|P-Y\|_{F r o}^{2}$

正则化项 $\Omega$

对于正则化项的选择，作者有两点考虑：

应该包含对于 $V S$ 的约束，是因为 $V S$ 代表属性空间中的向量在特征空间中的投影，对 $V S$ 加以约束，理想上保证了所有signature在特征空间里在空间离有相似的欧几里得范数，能够更公平的比较不同的signature，同时能够防止由于高度不平衡数据引发的问题。
还应该包含对 $V^TX$

最低0.47元/天解锁文章

River_J777

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Zero-shot Learning零样本学习论文阅读（二）——An embarrassingly simple approach to zero-shot learning

Zero-shot Learning零样本学习论文阅读（二）——An embarrassingly simple approach to zero-shot learningESZSL算法概况背景前提思路算法原理模型求解损失函数LLL正则化项Ω\OmegaΩ参考文献这篇论文提出了一种新的zero-shot learning方法“Embarrassingly simple Zero-Shot Learning”，后来被简写作EsZSL。之所以叫做“embarrassingly simple”，是因为这种新
复制链接

扫一扫