CMU提出「十字绣网络」,自动决定多任务学习的最佳共享层



在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。


在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。


点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 77 篇文章

本期推荐的论文笔记来自 PaperWeekly 社区用户 @Cratial。多任务学习是机器学习的重要组成部分,但是对于应用深度学习进行多任务学习时会遇到一个棘手的问题,那就是我们该如何确定网络的共享部分针对不同的任务,其最佳共享层往往不同。


外,针对不同的多任务学习,我们需要根据任务需求设计不同的共享层,并没有统一的标准。因此,本文针对这一问题设计了“十字绣”单元,通过端对端的学习来自动决定共享层

如果你对本文工作感兴趣,点击底部阅读原文即可查看原论文。

关于作者:吴仕超,东北大学硕士生,研究方向为脑机接口、驾驶疲劳检测和机器学习。

■ 论文 | Cross-stitch Networks for Multi-task Learning

■ 链接 | https://www.paperweekly.site/papers/1969

■ 作者 | Ishan Misra / Abhinav Shrivastava / Abhinav Gupta / Martial Hebert


引出主题


多任务学习是机器学习的重要组成部分,但是在应用深度学习进行多任务学习时会遇到一个棘手的问题,那就是我们该如何确定网络的共享部分。针对不同的任务,其最佳共享层往往不同。 


本文使用 AlexNet 网络分别进行图像检测、图像属性生成及图像语义分割、图像平面法向量生成(Surface Normal)等多任务学习。针对两个任务,作者分别从 fc8 层进行共享,一直测试到两者完全不进行共享的为止。


 图1


实验结果如图 1 所示,其中,图 1(b)是不同共享层完全独立时的效果对比,可以看出对于任务一来说,共享部分在 conv4 时所能达到的效果,针对于任务二来说,在 fc7 层的效果最好。


此外,针对不同的多任务学习,我们需要根据任务需求设计不同的共享层,并没有统一的标准。因此,本文针对这一问题设计了“十字绣”单元,通过端对端的学习来自动决定共享层


“十字绣”单元与网络设计


Cross-stitch Unit


本文的核心就在这里,设计“十字绣”单元的思想如图 2 所示,通过在两个网络的特征层之间增加“十字绣”单元可以使网络自动学习到需要共享的特征。


 图2


其中的“十字绣”单元就是一个系数矩阵。其表达式如式(1)所示。



针对这个“十字绣”单元如何进行端对端学习呢?作者给了具体的计算公式:



在下文中,为了方便,将 αAB 及 αBA 统称为 αD 表示不同任务的权重值,αAA 及 αBB 统称为 αS 表示相同任务的权重值。


“十字绣”网络设计 


图 3 是作者通过对网络添加“十字绣”单元设计的网络。


 图3


网络设计好之后,作者又针对网络提出了以下几个问题: 


1. 如何对“十字绣”单元进行初始化,及如何设置“十字绣”单元的学习速率? 


作者认为初始值设置应该在 [0,1] 之间,此外,作者还针对初始值及学习速率的设计进行了实验,以决定如何对两者进行设计能够达到最优效果。


2. 如何对网络 A 和 B 进行初始化?


如何对 A、B 进行初始化呢?作者提出了两种方案,第一种就是网络全用由 ImageNet 训练出的参数进行初始化,然后对整个“十字绣”网络进行训练。第二种是针对一种任务在网络上进行微调,然后再添加“十字绣”单元,并对网络进行训练。 


参数选取 


针对 2.2 中提到的两个问题,作者分别尝试了不同的策略来对参数进行选择。实验结果如表 1 所示:


 表1


在对“十字绣”单元进行训练时作者发现,用来更新网络参数的学习速率相对于“十字绣”单元而言太小了,以至于无法得到好的效果,实验结果如表 2 所示:


 表2


关于如何对网络 A、B 进行初始化,作者同样进行了实验,实验结果如表 3 所示:


 表3


表 4 展示了在 αD 及 αS 取不同的初始值时,最终网络各层各个通道的 αD 及 αS 的值的分布情况。其中 αD 越大说明共享程度越大,αS 越大,说明特征的特殊性越强。


 表4


实验及结果分析


为验证本文算法的有效性,作者分别在 NYU-v2 数据集进行了图像语义分割及图片平面法向量生成实验,在 PASCAL VOC 2008 数据集上进行了物体检测和属性预测实验。 


作者分别针对单任务网络、结合两个单任务的网络(文中称为“ensemble”)、多任务网络(如图 1 中那样尝试在各个特征层共享特征)进行了实验。平面法向量生成及图像语义分割的实验结果如表 5 所示:


 表5


从表 5 可以看出,使用“十字绣”单元的网络均能在两个任务上得到较好的结果。此外,作者分析在图像语义分割任务中,存在严重的数据匮乏问,如图 5 中黑线所示,wall、floor 的数据数量远超出其余的类别数,其中,蓝色柱状表示采用“十字绣”单元的多任务学习相对于单任务学习在效果上的增益,从图中可以看出,数量越少的类别所获得增益越多。


 图5


图像检测及属性预测的实验结果及增益情况分别如表 6 及图 6 所示:


 表6


 图6


总结与分析


虽然本文作者提到他们的方法相对于传统方法不需要去依次尝试如何选取所要共享的特征层,但是增加的“十字绣”单元同样带来了很多麻烦的东西,例如,如何进行初始化,如何设置学习速率。最终的实验结果表明,使用该方法对多任务学习的性能有一定的提升。

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!



点击标题查看更多论文解读: 



 戳我查看招募详情


#作 者 招 募#


让你的文字被很多很多人看到,喜欢我们不如加入我们

           


关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。


▽ 点击 | 阅读原文 | 查看原论文

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
几篇CVPR关于multi-task的论文笔记整理,包括 一、 多任务课程学习Curriculum Learning of Multiple Tasks 1 --------------^CVPR2015/CVPR2016v--------------- 5 二、 词典对分类器驱动卷积神经网络进行对象检测Dictionary Pair Classifier Driven Convolutional Neural Networks for Object Detection 5 三、 用于同时检测和分割的多尺度贴片聚合(MPA)* Multi-scale Patch Aggregation (MPA) for Simultaneous Detection and Segmentation ∗ 7 四、 通过多任务网络级联实现感知语义分割Instance-aware Semantic Segmentation via Multi-task Network Cascades 10 五、 十字绣网络多任务学习Cross-stitch Networks for Multi-task Learning 15 --------------^CVPR2016/CVPR2017v--------------- 23 六、 多任务相关粒子滤波器用于鲁棒物体跟踪Multi-Task Correlation Particle Filter for Robust Object Tracking 23 七、 多任务网络中的全自适应特征共享与人物属性分类中的应用Fully-Adaptive Feature Sharing in Multi-Task Networks With Applications in Person Attribute Classification 28 八、 超越triplet loss:一个深次的四重网络,用于人员重新识别Beyond triplet loss: a deep quadruplet network for person re-identification 33 九、 弱监督级联卷积网络Weakly Supervised Cascaded Convolutional Networks 38 十、 从单一图像深度联合雨水检测和去除Deep Joint Rain Detection and Removal from a Single Image 43 十一、 什么可以帮助行人检测?What Can Help Pedestrian Detection? (将额外的特征聚合到基于CNN的行人检测框架) 46 十二、 人员搜索的联合检测和识别特征学习Joint Detection and Identification Feature Learning for Person Search 50 十三、 UberNet:使用多种数据集和有限内存训练用于低,中,高级视觉的通用卷积神经网络UberNet: Training a Universal Convolutional Neural Network for Low-, Mid-, and High-Level Vision using Diverse Datasets and Limited Memory 62 一共13篇,希望能够帮助到大家

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值