【DAY9-Cross-Stitch】多任务学习-十字绣模块原理

学习文章 link
更好的文章link

在多任务学习中,没有明确的准则指导我们如何确定参数的共享部分。为了说明我们其实不明确知道该共享哪些参数,作者进行了一个实验,实验为2组多任务学习实验,通过共享不同层的模型参数,得到了两组任务在不同的参数共享策略下的性能对比,实验结果说明了不同任务的最佳分割比(共享层和特定任务的表示比例)是不一样的,这取决于手头的任务类型。枚举每一种可能的网络拆分是一种可能的实现,但是这种做法十分笨拙,费时,因此Cross-Stitch建立了一个新的单元,能够自动决定当前任务的最佳共享层,也就是可以使网络自动学习到需要共享的特征。
在这里插入图片描述

十字绣单元将来自两个任务的特征图进行线性组合,然后将得到的新的activation maps(就是特征图)作为输入送到下一层的卷积中。下面的公式就是cross-stitch单元,其中αAB和αBA就是要学习的共享权重。有了这个单元,网络就可以通过将αAB和αBA设置为0,来结束共享;通过将αAB和αBA附上更高的值来提高共享的程度。同时,由于cross-stitch单元中是线性组合,因此反向传播时进行梯度计算也是比较容易的。
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值