TCA(Transfer Componet Analysis)是一种边缘分布自适应方法,属于迁移学习中数据分布自适应的一种经典方法。由香港科技大学Q Yang教授及其团队于2011年提出。下面对相关问题和方法进行总结。
问题描述
在我们构建机器学习模型时,训练数据Xs的分布P(Xs)于 测试数据(或者是实际应用数据)Xt的分布P(Xt)并不一致。这会导致我们训练出的模型的鲁棒性变差,并且在测试中可能很难有一个好结果。在本文中,我们将Xs所在的数据域称为源域(surce domain)Xt所在的数据域称为目标域(target domain)。
解决办法
maximum mean discrepancy:
为了解决这个问题,我们想要学习一种映射,使
这样二者的条件分布也会近似
这里就有一个问题,如何衡量两个域的分布的距离?只有有可量化的距离我们才能衡量并且构造函数使源域和目标