自动寻找如何共享特征层的“十字绣”网络:Cross-stitch Networks for Multi-task Learning

本文提出了一种名为“十字绣”(Cross-stitch)的网络结构,用于多任务学习中的特征共享。通过端对端学习,网络能自动决定不同任务间的共享层。实验表明,Cross-stitch网络在图像语义分割、平面法向量检测等任务上提高了性能,尤其是在数据量较小的类别上效果显著。然而,网络的初始化和学习速率设置仍然是挑战。
摘要由CSDN通过智能技术生成

1、简介

多任务学习是机器学习中重要的一部分,关于多任务学习的更多内容可以去看这篇文章。但是对于应用深度学习进行多任务学习会遇到一个棘手的问题,那就是我们该如何确定网络的共享部分。针对不同的任务,其最佳共享层往往存在不同,其中作者针对使用AlexNet网络分别进行图像检测、图像属性生成及图像语义分割、图像平面法向量(Surface Normal)进行多任务学习,针对两个任务,作者分别从fc8层进行共享,一直测试到两者完全不进行共享的情况。实验结果如图1所示,其中图1(b)部分是不同共享层与完全独立时的效果对比,可以看出对于任务一来说,共享部分在conv4时所能达到的效果,针对于任务二来说,在fc7层的效果最好。因此,针对于不同的多任务学习来说,一般我们需要根据任务需求设计不同的共享层,没有统一的标准。本文就针对这一问题设计了“十指绣”单元,可以通过端对端的学习来自动决定共享层。

图1 

2、“十字绣”结构

这篇论文的核心就在这里,设计“十字绣”单元的思想如图2所示,通过在两个网络的特征层之间增加“十字绣”单元可以使网络自动学习到需要共享的特征。其中“十字绣”单元就是一个系数矩阵。其表达式如式(1)所示。从这个公式中可以明显看出,当值为0时,说明两者没有共享的特征,相反的,当两者的值越大,说明共享部分越大。


图2

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值