基于注意力机制的端到端的多任务学习

本文介绍了一种名为多任务注意网络(MTAN)的端到端多任务学习方法,它通过注意力机制自动学习任务共享和特定任务的特征。MTAN解决了多任务学习中的网络结构共享和损失函数权重平衡问题,适用于多种图像处理任务,并在CityScapes、NYUv2数据集及视觉十项全能挑战上展示了优越性能。
摘要由CSDN通过智能技术生成

简介

越来越多的研究开始聚焦于多任务学习,End-to-End Multi-Task Learning with Attention一文中考虑了交通场景中的多任务学习,并且提出了不同具体任务的注意力模块机制。文中所提出的结构可以通过端到端的方式完成训练,易于实现且参数高效,是目前最先进的多任务学习方法,最重要的是文中给出了开源的代码,这一点对于很多初学者是非常重要的。https://github.com/lorenmt/mtan,通过多任务学习的方式具体完成了深度图像和语义分割图像的生成(已经在cityscapes上面进行了验证,同时展示了网络在更具挑战的室内场景效果)。
图1 网络结构示意图
文中还分析了目前多任务学习存在的两个困难:
1)网络结构如何共享
多任务学习体系结构应该同时表达任务共享和任务特定的特性。通过这种方式,网络被鼓励学习一个通用的表示(以避免过度拟合),同时也提供了学习为每个任务量身定制的特性的能力(以避免欠拟合)。
2)损失函数(如何平衡任务)
一个多任务损失函数,它对每个任务的相对贡献进行加权,应该使所有任务的学习具有同等的重要性,而不是让更容易的任务占主导地位。手动调整损耗权值是繁琐的,最好是自动学习权值,或者设计一个对不同权值具有鲁棒性的网络
然而,大多数先前的MTL方法只关注这两个挑战中的一个,同时维护另一个的标准实现。在这篇论文中,我们介绍了一种统一的方法,通过设计一个新的网络(i)使任务共享和特定任务的特征能够自动学习,从而(ii)学习对损失加

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值