迁移学习二——JDA

最新推荐文章于 2023-06-12 14:59:04 发布

ZLBryant

最新推荐文章于 2023-06-12 14:59:04 发布

阅读量4k

点赞数

分类专栏：机器学习迁移学习文章标签：迁移学习 JDA

本文链接：https://blog.csdn.net/qq_40824311/article/details/102731202

版权

JDA（Joint Distribution Adaptation）是一种迁移学习方法，旨在减小源域和目标域之间的边缘概率分布和条件概率分布差异。通过最大化映射后数据的方差保留属性，并采用MMD距离减小分布差异。在目标域无标签数据的情况下，JDA使用源域分类器生成伪标签来逼近条件概率分布。算法包括属性保留、减小边缘和条件概率分布差异，并通过引入核技巧处理非线性问题。最终目标函数结合了方差最大化和分布差异最小化，通过拉格朗日乘子法求解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本篇文章是对论文《Transfer Feature Learning with Joint Distribution Adaptation》进行学习

1 问题提出

很多域适应的方法没有同时减小源域和目标域之间的边缘概率分布和条件概率分布的差异，之前学习的TCA也是如此，TCA学习一组变换使得映射后的源域数据和目标域数据的边缘概率分布差异减小，然后进行了假设，认为这样的可以使得相应的条件概率分布减小，但并没有直接对条件概率分布进行处理；也有一些方法同时减小了边缘概率分布和条件概率分布之间的差异，但这些方法需要在目标域有带标签的数据。
下面我们来描述JDA应用的场景及目标。
令源域数据 $D_{S}=$ { $x_{S_{1}},y_{S_{1}}),(x_{S_{2}},y_{S_{2}}),...,(x_{S_{n_{1}}},y_{S_{n_{1}}})$ }，目标域数据 $D_{T}=$ { $x_{T_{1}},x_{T_{2}},...,x_{T_{n_{2}}}$ }， $P_{S}(x_{s})$ 为 $D_{S}$ 的边缘概率分布， $P_{T}(x_{t})$ 为 $D_{T}$ 的边缘概率分布， $Q_{S}(y_{s}|x_{s})$ 为 $D_{S}$ 的条件概率分布， $Q_{T}(y_{t}|x_{t})$ 为 $D_{T}$ 的条件概率分布（注意 $y_{t}$ 在目标域数据中是不存在的），其中 $x_{s}\in D_{S}$ ， $x_{t}\in D_{T}$ 。
JDA假设的场景：源域和目标域的特征空间和标签空间一致，但 $P_{S}(x_{s})\neq P_{T}(x_{t})$ ， $Q_{S}(y_{s}|x_{s})\neq Q_{T}(y_{t}|x_{t})$ ，且目标域中所有数据未进行标注。
JDA目标：映射后数据的属性尽可能保留，缩小映射后源域和目标域的边缘概率分布差异和条件概率分布差异。