摘要:近年来,迁移学习 (transfer learning) 的应用取得了巨大的进展,它是一种利用source domain的知识来提高target domain模型性能的方法,其成功关键在于领域之间共享通用知识。迁移学习方法通常假设source domain和target domain具有相同的特征和标签空间,这被称为同质迁移学习 (homogeneous transfer learning) ,但这种情况并不总是切实可行的。在实际应用中,source domain和target domain通常在特征、数据分布和标签方面存在差异, 获取与target domain完全相同的source domain数据是具有挑战性或高成本的任务,但随意消除这些差异并不总是明智的选择。因此,异质迁移学习 (heterogenous transfer learning) 应运而生,它承认并处理source domain和target domain之间的差异,成为了很多实际任务的一种很有前景的方法。本文是一份heterogeneous transfer learning (HTL) 方法最新发展的全面综述,为未来的研究提供了系统性的指南。我们的文章总结了各种学习场景的方法,讨论了当前研究的局限性,并全面讨论了各种应用背景,包括自然语言处理 (Natural Language Processing)、计算机视觉 (Computer Vision)、多模态 (Multimodality) 和生物医学 (Biomedicine) 领域,以帮助读者获得在heterogeneous transfer learning方面更深入的理解并且对未来的研究有所启发。
关键词:异质迁移学习,知识迁移,领域自适应,基于数据的方法,基于模型的方法。
Key words: Heterogeneous transfer learning, knowledge sharing, domain adaptation, data-based method, model-based method
本文主要贡献:
- 相比于homogeneous transfer learning领域,heterogenous transfer learning是一个相对而言没有被充分探索的领域。本文详细讨论了此领域重要的论文,涵盖了60多种方法,详细介绍了它们的技术细节和应用,填补了当前文献中的重要空缺。
- 本文全面讨论了在不同学习场景下现有的heterogenous transfer learning技术,为未来的研究提供了系统的指导。
- 本文讨论了heterogenous transfer learning技术在各种领域(自然语言处理、计算机视觉、多模态和生物医学领域)中的应用。
- 本文指出了当前研究的局限性,为未来的研究发展提供了重要的指引。
文章链接:A survey of Heterogeneous Transfer Learning
GitHub链接: