迁移学习分类概述
基于样本的迁移
若我们考虑从一个拥有猫和狗的带标签数据集(源域)中学习到有关猫的知识,去进行一个仅含有猫的数据集(目标域)识别,则需要赋予源域中的猫以更高的权重,尽量消除狗的影响。代表方法: TrAdaBoost,论文地址:Boosting for transfer learning
基于特征的迁移
以最小化边缘分布及条件分布为目的构造新特征,引用Pan在迁移学习综述中的描述。
假设我们有个文件分类的任务,当source文件和target文件对应不同的topic的时候,我们可以理解为source和target domain的边缘概率分布不同。
同样是这个文件分类问题,假设source和target的文件的label有两类(语文,数学)。source里语文的概率高达90%,target里语文的概率只有20%。那么我们可以理解为source和target的learning task条件概率分布是不同的。