《迁移学习》学习笔记(一)


前言

鄙人正在准备医学图像处理的预面试,想要简单了解一下有关迁移学习的相关内容,所以编写了此学习笔记。学习笔记主要目的是记录自己的学习过程,以便后续翻看复习;次要目的是与广大程序员朋友们交流。如果有发现理解有误或者编写出错的地方,还望各位斧正。


学习迁移学习,我这里首先参考的是机械工业出版社出版的由杨强、张宇教授主编的《迁移学习》一书。后文的笔记内容也是大量引用书中的原句,如有侵权请速与我联系。

一、绪论

(一).迁移学习的概念

1、机器学习面临的问题以及迁移学习的产生背景:
①在应用机器学习算法前,我们无法获得各个领域的大量训练数据。
②许多应用场景数据量小。当前机器学习的成功应用依赖于大量有标签数据的可用性。
③机器学习模型需要强鲁棒性。传统的机器学习算法假设训练和测试数据来自相同的数据分布。然而,这种假设对于许多实际应用场景来说。在许多情况下,数据分布不仅会随着时间和空间而变化,也会随着不同的情况变化,因此我们可能无法使用相同的数据分布来对待新的训练数据。
④个性化和定制问题。根据个人喜好和需求为每个用户提供个性化的服务是至关重要且具有经济效益的。在许多实际应用中,我们只能从单个用户收集到的非常少的个人数据。
⑤用户隐私和数据安全。在实际应用中,我们常常需要和其他组织合作,从而需要利用多个数据集。这些数据集通常属于不同的所有者,并且出于隐私或安全考虑不能彼此泄露。

简而言之,迁移学习是一种机器学习范式,其算法能够从一个或多个应用场景中提取知识以帮助提高目标场景中的学习性能。与需要大量精心准备的训练数据作为输入的而传统机器学习技术相比,迁移学习也可以理解为一种新的学习范式。也是解决许多大规模线上应用中数据稀疏性和冷启动的一种方式。
基于迁移学习的方法,一旦我们在一个领域中获得了训练好的模型,就可以将这个模型引入其他类似的领域。因此,为了设计一个合理的迁移学习的学习方法,找到不同领域任务间准确的“距离”度量方式是必须的。如果两个领域间的“距离”过大,那么我们可能不希望应用迁移学习技术,因为这样的学习可能产生一些负面影响。另一方面,如果两个领域非常接近,则可以有效地应用迁移学习。
在机器学习中,领域之间的距离通常根据描述数据的特征来度量。在图像分析中,特征可以是图像中的像素或者区域,例如颜色和形状。一旦两个领域非常接近,我们就能确保AI模型可以从一个已开发好的领域迁移到一个前开发的领域,从而使AI应用更少地依赖数据。在某种程度上,迁移学习可以促进AI成为一种更为包容的、为每个人服务的技术。
2、定义
域(D):域由两部分组成,特征空间X和边缘概率分布PX,D={X,PX}

任务(T):任务也由两部分组成,标签空间Y和预测函数f(·)。

源域与目标域:为简单起见,我们现在关注只有一个源域Ds和一个目标域Dt的情况,两个域是目前为止在文献中最普遍的研究对象。

迁移学习:给定源域和Ds和学习任务Ts、目标域Dt和学习任务Tt,迁移学习的目的是获取源域Ds和学习任务Ts中的知识以帮助提升目标域中的预测函数ft(·)的学习,其中Ds≠Dt或者Ts≠Tt。

同构迁移学习:给定源域Ds和学习任务Ts、目标域Dt和学习任务Tt,同构迁移学习的目的是获取源域Ds和学习任务Ts中的知识以帮助提升目标域中的预测函数ft(·)的学习,其中Xs∩Xt≠空且Ys=Yt,但PXs≠PXt。

异构迁移学习:给定源域Ds和学习任务Ts、目标域Dt和学习任务Tt,同构迁移学习的目的是获取源域Ds和学习任务Ts中的知识以帮助提升目标域中的预测函数ft(·)的学习,其中Xs∩Xt≠空且Ys≠Yt。

除了使用特征空间和标签空间的同构性外,还可以通过考虑目标域中是否有标签数据将现有的迁移学习方法分为监督迁移学习、半监督迁移学习、无监督迁移学习,其监督概念是对于目标域是否有标签来定义的。

如何迁移?
基于样本的算法,其中迁移的知识对应于源样本的权重;
基于特征的算法,其中迁移的知识对应于源域和目标域中特征所共享的子空间;
基于模型的算法,其中迁移的知识嵌入源域模型的一部分中;
基于关系的算法,其中迁移的知识对应于源域中实体之间的特定规则。

3、迁移学习的基础研究问题
1、迁移什么?
由于迁移学习的目的是跨不同领域迁移知识,因此第一个问题就是可以迁移哪些跨域的知识来提高目标域的泛化性能。
2、如何迁移?
在确定了要迁移的知识后,后续问题便是如何将知识编码到学习算法中进行迁移。
3、何时迁移?
何时迁移实在询问在哪些情况下应该进行迁移学习或者可以安全地进行迁移学习。
这三个问题的背后的一个基本问题是如何衡量任何一对域或者任务之间的“距离”。这也就设计到如何度量“距离”!

4、应用
1、图像理解
2、生物信息学和生物成像
3、推荐系统和协同过滤
4、机器人和汽车自动驾驶
5、自然语言处理和文本挖掘

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值