开放集域适应文献阅读一

iQoMo

已于 2024-04-30 15:48:07 修改

阅读量768

点赞数

文章标签：算法人工智能

于 2022-11-16 20:15:39 首次发布

仅供学习参考！

本文链接：https://blog.csdn.net/weixin_44086522/article/details/127858134

版权

Open Set Domain Adaptation 开集域适应

1 本文贡献
2 方法
3 小结
参考文献

1 本文贡献

将开集的概念引入到域自适应问题中，并提出了开集域自适应（open set domain adaptation）。闭集域自适应（closed set domain adaptation）和开集域自适应之间的差异如图所示.
提出了一种适用于闭集和开集的域自适应方法.

2 方法

2.1 无监督开集域适应

给定源域中的一组类 $\mathcal{C}$ ，包括 $∣ C - 1∣$ 已知类和从其他无关类别中收集所有实例的附加未知类，我们的目标是用类 $c$ 标记目标样本 $\mathcal{T}=\left\{T_1, \ldots, T_{|\mathcal{T}|}\right\}，c∈ C$ . 通过 $d_{c t}=\left\|S_c-T_t\right\|_2^2$ 定义将目标样本 $T_t$ 分配给类 $c$ 的成本，其中 $T_t \in \mathbb{R}^D$ 是目标样本 $t$ 特征表示和 $S_c$ 的 $S_c \in \mathbb{R}^D$ 是由类 $c$ 标记的源域中所有样本的平均值. 将目标样本声明为异常值的成本由参数 $λ$ 定义.
在这里插入图片描述
其中有两个约束：

第一个约束是说，对于任意 target 中的一个样本，要么 $x_{ct} = 1$ ，要么 $o_t = 1$ . 也就是，这个样本要么是属于已知类别 $c$ ，要么是未知类别.
第二个约束是说，对于任意一个已知类别 $c$ ，至少要有一个 $x_{ct} = 1$ . 也就是，每个类别下都至少要有一个 sample. 不会存在有一个已知的共享类别，在 target 下找不到.

作者用 $x_{ct}$ 来标识 target domain 中的第 $t$ 个样本是否被标记为类别 $c$ ， $x_{ct} \in \left\{0，1\right\}$ 。同时，因为是 open set，所以，引入一个 $o_t$ 来标识第 $t$ 个样本是否为未知类别(outlier;unknown)， $o_t \in \left\{0，1\right\}$ 。接下来，把这个问题直接表示成了一个二值的整数规划问题.

2.2 半监督开集域适应

暂不赘述.

2.3 学习source到target的映射

作者在这里要学习的目标是一个变换矩阵 $W$ ， $\in \mathbb{R}^{DXD}$ . 通过 $W$ 可以把source变换到target空间中. 学习的目标函数是：
在这里插入图片描述
以矩阵形式重写：

通过求解偏导数，使其最小，可以求解出 $W$ .

在估计转换 $W$ 之后，我们将源样本映射到目标域. 因此，我们迭代解决分配问题并估计从源域到目标域的映射的过程，直到收敛为止. 在该方法收敛之后，我们在转换后的源样本上以一对一的设置训练线性 SVM.
在这里插入图片描述

3 小结

总的学习过程就是，学习label和学习映射进行交替，直到收敛或者目标值小于某一值即可. 作者在文章中说，迭代次数一般少于10次，通常为3~5次即可.

参考文献

[1] Busto P P , Gall J . Open Set Domain Adaptation[C]// IEEE International Conference on Computer Vision. IEEE, 2017.
[2] https://zhuanlan.zhihu.com/p/31230331