1.什么时候要进行迁移学习?
目前大多数机器学习算法均是假设训练数据以及测试数据的特征分布相同。然而这在现实世界中却时常不可行。例如我们我们要对一个任务进行分类,但是此任务中数据不充足(在迁移学习中也被称为目标域),然而却有大量的相关的训练数据(在迁移学习中也被称为源域),但是此训练数据与所需进行的分类任务中的测试数据特征分布不同(例如语音情感识别中,一种语言的语音数据充足,然而所需进行分类任务的情感数据却极度缺乏),在这种情况下如果可以采用合适的迁移学习方法则可以大大提高样本不充足任务的分类识别结果。也即是大家通常所说的将知识迁移到新环境中的能力,这通常被称为迁移学习。有些时候如果迁移的不合适则会导致负迁移,例如当源域和目标域的任务毫不相关时有可能会导致负迁移。
2.迁移学习迁移什么?
在一些学习任务中有一些特征是个体所特有的,这些特征不可以迁移。而有些特征是在所有的个体中具有贡献的,这些可以进行迁移。(简单总结就是不迁移样本个体特有的特征,迁移那些对所有个体都有贡献的特征。)
3.迁移学习的种类
归纳迁移学习(Inductive Transfer Learning),直推式迁移学习(Transductive Transfer Learning),无监督迁移学习(unsupervised transfer learning)
归纳迁移学习(Inductive Transfer Learning)
目标任务与原任务不同,目标域和源域可能相同也可能不同。即。这种迁移学习方式又被分为四种形式
1)实例知识迁移学习(Transferring knowledge of instances)
基于实例的迁移学习的基本思想是,尽管目标域中部分带标签训练数据和源训练数据或多或少