迁移学习与域自适应

最新推荐文章于 2024-05-25 17:22:41 发布

AI Bro

最新推荐文章于 2024-05-25 17:22:41 发布

阅读量5.1k

点赞数 12

分类专栏：深度学习优质文章文章标签：迁移学习与域自适应区别迁移学习域自适应域自适应到底是什么

本文链接：https://blog.csdn.net/weixin_41466575/article/details/119672926

版权

深度学习同时被 2 个专栏收录

22 篇文章 11 订阅

订阅专栏

优质文章

14 篇文章 1 订阅

订阅专栏

文章目录

1 摘要

本文会介绍迁移学习与域自适应的具体区别
首先，解答一个问题：如果说两个image服从同一种分布,到底是什么意思？
之后通过数学理论公式，严谨的将迁移学习与域自适应区分开来，并介绍两者相应的应用场景。
坚持看下去，我会讲清楚，我也相信你会有所收获。

2 思路

2.1 Question：

如果说两个image服从同一种分布,到底是什么意思？

Answer：

该问题在 AI或机器学习中经常出现，动辄要求输入图像数据独立同分布。what the fuck？自己没说我怎么知道同分布什么意思？基础概念没懂，它的一些相关公式也就稀里糊涂地理解，学起来真的难。深有感触的评论区扣 “ 确实！”。
首先，我们必须了解一张图片可以通过其像素值表示出来。例如，一张256*256的灰度图可以通过65536维的向量，每个维度值的范围是0-255，来表示出来。
想象一下，65536维的向量服从均匀分布 $x∼U[0,255]^{65536}$ ，它的图像该是什么样。如果我们将这样一种随机采样得到的向量解释为图像，你觉得我们看到一张脸的可能性大吗？当然不可能，实际上你会看到如下的噪音图。
为什么你知道你看到的不是一张脸？没错，因为你知道一张脸不是由均匀分布的像素组成。换句话说，因为你直觉地知道一张脸的像素值构成的向量，分布不服从 $x∼U[0,255]^{65536}$ ，而是有另外的一种分布。
因此，我们说两个image服从同一种分布。其实就是将它们转化为向量后，该向量服从某一种分布。如下图，直觉上你自然地知道mnist和mnist-m分布不同，但是其内部图像服从同一分布。解释完毕，还有不懂评论区留言。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-msv6CDfN-1628828549571)(https://nbviewer.jupyter.org/github/vistalab-technion/cs236605-tutorials/blob/master/tutorial6/img/mnist_m.png)]

2.2 理论公式

假设我们数据集中有 $N$ 个图像 $\left\{(x^i,y^i)\right\}_{i=1}^N$ ，其中：

$x^i = \left(x^i_1, \dots, x^i_D\right) \in \mathcal{X}$ 是image， $D$ 是image的维度
$y^i \in \mathcal{Y}$ 是标签
标签 $C$ 个类别， $\mathcal{Y} = \{0,\dots,C-1\}$ ，因此 $y^i$ 是类别标签
$\mathcal{X},\mathcal{Y}$ 分别是image space与label space。作为一个分类任务，我们需要做的就是从数据中学习 $P (Y ∣ X)$ （给定数据X，其分类成Y的概率）

Finally：

域 ${\mathcal{D}}$ 被定义为 $\mathcal{D}=\left\{\mathcal{X},P(X)\right\}$ （可以理解为数据集）
学习任务 $\mathcal{T}$ 被定义 $\mathcal{T}=\{\mathcal{Y},P(Y|X)\}$ （可以理解为数据集分类任务）

Definition:

给定：

源域 $\mathcal{D}_S$ 和学习任务 $\mathcal{T}_S$ （大白话：训练集和训练集分类任务）
目标域 $\mathcal{D}_T$ 和学习任务 $\mathcal{T}_T$ （大白话：测试集和测试集任务）

迁移学习目标是通过利用 $\mathcal{D}_S$ 和 $\mathcal{T}_S$ 的信息来提升目标域的学习任务 $\mathcal{T}_T$ ，此时

$\mathcal{D}_S \neq \mathcal{D}_T$ , or
$\mathcal{T}_S \neq \mathcal{T}_T$

也就是说，迁移学习的范畴很大。源域可以与目标域数据不同，源域与目标域任务也能不同。如下举例：

2.3 任务场景

2.3.1 同样的域，不同任务

Case1：标签空间 label space 不同， $\mathcal{Y}_S \neq \mathcal{Y}_T$ ：

例如：标签空间的类别数量不同

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-09LJKngp-1628828549573)(C:\Users\刘志远\AppData\Local\Temp\1628826393498.png)]$

Case2：标签的条件分布不同， $P(Y_S|X_S)\neq P(Y_T|X_T)$ ：

源域与目标域的标签分布不同，例如可能源域为1的图片很多；目标域为2的图片很多，类别不平衡。

2.3.2 同样任务，不同的域

Case1：源域与目标域图像空间 image space 不同， $\mathcal{X}_S \neq \mathcal{X}_T$ ：

例如， $\mathcal{X}_S$ 是灰度图像空间， $\mathcal{X}_T$ 是彩色图像空间

Case2：源域与目标域图像空间的数据分布不同， $P(X_S)\neq P(X_T)$ ：

例如：源域包含手绘图像，目标域则是机器拍的图像

关键来了，这个常见的场景又称之为域自适应 domain adaptation。

由此可见：

迁移学习涉及范畴很大，包括如上全部。但如果仅仅只是源域与目标域图像空间的数据分布不同，那就属于域自适应的范畴。也就是说， $Domain\; Adaptation \in Transfer\;Learning$

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uaEec5Td-1628828549575)(C:\Users\刘志远\AppData\Local\Temp\1628827569381.png)]$

3 总结

迁移学习范畴很大，不管源域与目标域，源域学习任务与目标域学习任务相不相同，都属于迁移学习的范畴
但如果仅仅只是源域与目标域图像空间的数据分布不同，那就属于域自适应的范畴。当然， $Domain\; Adaptation \in Transfer\;Learning$ ，也能说是迁移学习范畴啦。
这篇文章算是科普 ”什么是迁移学习与域自适应？“。后续也会出内容的相关代码实现。

附录

参考资料：

https://nbviewer.jupyter.org/github/vistalab-technion/cs236605-tutorials/blob/master/tutorial6/tutorial6-TL_DA.ipynb#CS236605:-Deep-Learning

AI Bro

关注

12
点赞
踩
37

收藏

觉得还不错? 一键收藏
5
评论
迁移学习与域自适应

文章目录1 摘要2 思路2.1 Question：2.2 理论公式2.3 任务场景2.3.1 同样的域，不同任务2.3.2 同样任务，不同的域3 总结附录1 摘要本文会介绍迁移学习与域自适应的具体区别首先，解答一个问题：如果说两个image服从同一种分布,到底是什么意思？之后通过数学理论公式，严谨的将迁移学习与域自适应区分开来，并介绍两者相应的应用场景。坚持看下去，我会讲清楚，我也相信你会有所收获。2 思路2.1 Question：如果说两个image服从同一种分布,到底是什么意思？
复制链接

扫一扫

专栏目录