TCA（迁移成分分析）

最新推荐文章于 2024-04-11 15:04:25 发布

鄞舯暹

最新推荐文章于 2024-04-11 15:04:25 发布

阅读量4.1k

点赞数 4

分类专栏：迁移学习

本文链接：https://blog.csdn.net/weixin_44390521/article/details/104336224

版权

迁移学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

TCA原版文章：S. J. Pan, I. W. Tsang, J. T. Kwok and Q. Yang, “Domain Adaptation via Transfer Component Analysis,” in IEEE Transactions on Neural Networks, vol. 22, no. 2, pp. 199-210, Feb. 2011.doi: 10.1109/TNN.2010.2091281
https://zhuanlan.zhihu.com/p/26764147

问题描述

源域(src)数据：源域数据 $D_s = {(x_{S_1},y_{S_1})，···，(x_{S_{n_1}},y_{S_{n_2}})}$ ，其中 $x_S$ 是输入， $y_S$ 是输出
目标域数据： $D_T = {{x_{T_1},···，x_{T_{n_2}}}}$
目标：正确预测目标域数据的标签
假设 $P(X_S)、Q(X_T)$ 分别是源域和目标域的边缘分布，一般来说，使用 $\neq Q$ ，但是条件分布 $P(Y_S|X_S) = Q(Y_T|X_T)$

最大均值差异（MMD）:

设 $X={x_1,x_2,···，x_{n_1}}$ 和 $Y=y_1,y_2,···，y_{n_2}$ 是分布服从分布 $P$ 和 $Q$ 的随机变量，使用MMD距离估计两个分布的距离：
$||\frac{1}{n_1}\sum_{i=1}^{n_1}\phi(x_i)-\frac{1}{n_1}\sum_{j=1}^{n_2}\phi(x_j)||_H$
其中 $H$ 是再生核希尔伯特空间， $\phi$ 是 $\to H$ 的映射。

迁移成分分析（TCA）

TCA的目标是在已知道源数据的输入 $X_S$ 和输出 $Y_S$ 以及目标数据的输入 $X_T$ 时，预测目标数据的输出 $Y_T$ ，
TCA假设源数据和目标数据的边缘分布有很大的差异，但是条件分布 $P(Y_S|X_S) = Q(Y_T|X_T)$
TCA试图找到一种非线性映射 $\phi$ : $\to H$ ，使得源数据和目标数据经过非线性变换后（ $X_S \to X^{'}_S$ ， $X_T \to X^{'}_T$ ），其边缘分布相同（ $P(X^{'}_S) = Q(X^{'}_T)$ ），即TCA的目标是找到一个合适的映射，是经映射后的两个分布MMD距离最小：
$Dist(X_S^{'},X_T^{'}) = ||\frac{1}{n_1}\sum_{i=1}^{n_1}\phi(x_i)-\frac{1}{n_1}\sum_{j=1}^{n_2}\phi(x_j)||_H$

TCA目标优化

将MMD距离转换为矩阵形式（推导：https://zhuanlan.zhihu.com/p/26764147）:
$Dist(X_S^{'},X_T^{'}) = tr(KL)\space \space \space(1)$ ，
其中 $K是(n_1+n_2)\times(n_1+n_2)$ 的核矩阵， $\begin{bmatrix}K_{SS} & K_{TS} \\K_{ST} & K_{TT} \end{bmatrix}$ ，
$L=\begin{cases} \frac{1}{n_1} ,&\text x_i,x_j \in D_S \\[2ex] \frac{1}{n_2},&\text x_i,x_j \in D_T \\[2ex] -\frac{1}{n_1\times n_2},&\text others \end{cases}$
将核矩阵 $K$ 进行分解：
$(KK^{-\frac{1}{2}})(K^{-\frac {1}{2}}K)$ ，
使用一个 $m\times (n_1+n_2)$ 的矩阵 $\widetilde W$ 将特征矩阵映射的m维空间：
$\widetilde{K} = (KK^{-\frac{1}{2}}\widetilde W)(\widetilde W^TK^{-\frac {1}{2}}K) = KWW^TK$
其中 $K^{-\frac{1}{2}}\widetilde W$
使用定义 $\widetilde K$ 将两个域的MMD距离转换为：
$Dist(X_S^{'},X_T^{'}) = tr(\widetilde KL) = tr((KWW^TK)L)=tr(W^TKLKW) \space\space\space(2)$
3.提取迁移成分
根据（2）式，核学习问题转变成：
$min_Wtr(W^TW)+\mu tr(W^TKLKW)$
$s.t.W^TKHKW = I\space\space\space\space\space\space\space\space\space(3)$
其中 $tr(W^TW)$ 是正则化项，控制 $W$ 的复杂度， $\mu$ 是折中系数
$I\in R^{m\times m}$ ，为单位矩阵
$I_{n_1+n_2}-\frac{1}{n_1+n_2}11^T$ ，是中心矩阵， $1$ 是全为1的列向量， $W^TKHKW = I$ 避免 $W$ 的平方解。
优化问题（3）可以转化为：
$min_Wtr((W^TKLKW)^{-1}W^T(I+\mu KLK)W)\space\space\space\space\space(4)$
或
$max_Wtr((W^T+\mu(KLK)W)^{-1}W^TKHKW)\space\space\space\space\space(5)$
证明：
（3）式转化为拉格朗日对偶形式：
$tr(W^T(I+\mu KLK)W)-tr((W^TKHKW-I)Z)\space\space\space\space\space(6)$
其中 $Z$ 为对称矩阵，
对（4）式求导等0，可得：
$(I+\mu KLK)W=KHKWZ$ ，
左右两端乘上 $W^T$ ，可得(4)式，由于 $(I+\mu KLK)W$ 是非奇异矩阵，故可得到其等价式（5）。
根据核函数Fisher鉴别（KFD），W的解是 $(I+\mu KLK)^{-1}KHK$ 的前m个特征值。

鄞舯暹

关注

4
点赞
踩
24

收藏

觉得还不错? 一键收藏
2
评论
TCA（迁移成分分析）

问题描述源域(src)数据：源域数据 Ds=(xS1,yS1)，⋅⋅⋅，(xSn1,ySn2)D_s = {(x_{S_1},y_{S_1})，···，(x_{S_{n_1}},y_{S_{n_2}})}Ds=(xS1,yS1)，⋅⋅⋅，(xSn1,ySn2)，其中xSx_SxS是输入，ySy_SyS是输出目标域数据：DT=xT1,⋅⋅⋅，xTn2D_T = {{x_...
复制链接

扫一扫