论文笔记 UberNet : Training a ‘Universal’ Convolutional Neural Network

最新推荐文章于 2021-03-10 00:59:59 发布

潇湘_AQ

最新推荐文章于 2021-03-10 00:59:59 发布

阅读量4.8k

点赞数 4

本文链接：https://blog.csdn.net/u012905422/article/details/52507100

版权

Deep Learning 同时被 3 个专栏收录

32 篇文章 3 订阅

订阅专栏

Computer Vision

29 篇文章 0 订阅

订阅专栏

论文笔记

25 篇文章 0 订阅

订阅专栏

UberNet : Training a ‘Universal’ Convolutional Neural Network for Low-, Mid-, and High-Level Vision using Diverse Datasets and Limited Memory

这是一篇很有意思的文章，将CNN的许多用途一起结合训练一个网络进行，实现CNN的：
boundary detection (b) normal estimation (c) saliency estimation (d) semantic segmentation (e) semantic part segmentation (f) semantic boundary detection and (g) proposal generation and object detection

多功能的结合对于工业界应该有很深的意义，一个网络十分方便。

对于不同任务下网络的结合，主要需要解决的问题有以下2个：

（1）不同数据集上的训练

（2）内存大小的限制

对于问题（1）：

不同的数据集上同时训练时的统一，作者设计了如下图的网络，即为UberNet，结合多标签任务：图中最左是一个连续的降采样操作得到的影像金字塔，金字塔中每个图像都连接着独立的一个CNN网络。图中，C指的是VGG网络，结合B批处理的正则化操作，来得到特征，并得到对应的task的回应E。所有的回应E结合最终完成task-special 的操作。

对于问题（2）内存的问题：

作者修改了一系列内存的储存方式来进行内存问题的优化。下图为单个任务的Vanilla backpropagation方法：黑色箭头代表memory查找操作，黄色箭头代表储存操作，蓝色箭头代表前后向传播。在前向传播中，每层在bottom box中储存激活信号，而在后向传播中，激活信号与梯度信息（top boxes）通过loss层进行递归的计算。